trying to merge 7-20

YaleATLAS · Jul 20, 2016 · 9ade7d0 · 9ade7d0
2 parents d1c48fa + 292a0d3
commit 9ade7d0
Show file tree

Hide file tree

Showing 6 changed files with 272 additions and 21 deletions.
diff --git a/data_processing.py b/data_processing.py
@@ -17,7 +17,7 @@ def _pairwise(iterable):
     return izip(a, a)
 
 
-def read_in(class_files_dict, tree_name, particles):
+def read_in(class_files_dict, tree_name, particles, mode):
     '''
     takes in dict mapping class names to list of root files, loads them and slices them into ML format
     Args:
@@ -74,22 +74,33 @@ def read_in(class_files_dict, tree_name, particles):
         le: LabelEncoder to transform numerical y back to its string values
     '''
 
-    #convert files to pd data frames, assign key to y, concat all files
+    #convert files to pd data frames, assign key or mass to y, concat all files
+
     def _make_df(val, key):
         df = pup.root2panda(val, tree_name)
-        df['y'] = key
+        if mode == 'classification':
+            df['y'] = key
+        elif mode == 'regression':
+            try:
+                df['y'] = int(key[1:])
+            except ValueError:
+                df['y'] = 0
         return df
 
     all_events = pd.concat([_make_df(val, key) for key, val in class_files_dict.iteritems()], ignore_index=True)
-    
+
     X = OrderedDict()
     for particle_name, particle_info in particles.iteritems():
         logger.info('Building X_{}'.format(particle_name))
         X[particle_name] = all_events[particle_info["branches"]].values
 
-    #transform string labels to integer classes
-    le = LabelEncoder()
-    y = le.fit_transform(all_events['y'].values)
+    #transform string labels to integer classes for classification or set y for regression
+    if mode == 'classification':
+        le = LabelEncoder()
+        y = le.fit_transform(all_events['y'].values)
+    elif mode == 'regression':
+        le = None
+        y = all_events['y'].values
 
     w = all_events['yybb_weight'].values
 

diff --git a/nn_combined.py b/nn_combined.py
@@ -17,17 +17,26 @@ def NN_train(data, model_name):
     '''
 
     #defines training sets of different classes
-    X_jets_train=data['X_jet_train']
-    X_photons_train=data['X_photon_train']
-    y_train=data['y_train']
+    X_jets_train = data['X_jet_train']
+    X_photons_train = data['X_photon_train']
+    X_event_train = data['X_event_train']
+    y_train = data['y_train']
+    X_muons_train=data['X_muon_train']
+    X_electrons_train=data['X_electron_train']
 
     #set up sequential neural networks for the jet and photon classes 
     jet_channel = Sequential()
     photon_channel = Sequential()
+    event_level = Sequential()
+    muon_channel=Sequential()
+    electron_channel=Sequential()
 
     #declaring the shape of the first row of each class matrix
     JET_SHAPE = X_jets_train.shape[1:]
     PHOTON_SHAPE = X_photons_train.shape[1:]
+    EVENT_SHAPE = X_event_train.shape[1]
+    MUON_SHAPE = X_muons_train.shape[1:]
+    ELECTRON_SHAPE = X_electrons_train.shape[1:]
 
     #adding layers to the jet and photon class neural networks
     jet_channel.add(Masking(mask_value=-999, input_shape=JET_SHAPE, name='jet_masking'))
@@ -38,6 +47,17 @@ def NN_train(data, model_name):
     photon_channel.add(GRU(10, name='photon_gru'))
     photon_channel.add(Dropout(0.3, name='photon_dropout'))
 
+    event_level.add(Lambda(lambda x: x, input_shape=(EVENT_SHAPE, )))
+
+    muon_channel.add(Masking(mask_value=-999, input_shape=MUON_SHAPE, name='muon_masking'))
+    muon_channel.add(GRU(10, name='muon_gru'))
+    muon_channel.add(Dropout(0.3, name='muon_dropout'))
+
+    electron_channel.add(Masking(mask_value=-999, input_shape=ELECTRON_SHAPE, name='electron_masking'))
+    electron_channel.add(GRU(10, name='electron_gru'))
+    electron_channel.add(Dropout(0.3, name='electron_dropout'))
+
+
     #combining the jet and photon classes to make a combined recurrent neural network
     combined_rnn = Sequential()
     combined_rnn.add(Merge([jet_channel, photon_channel], mode='concat'))
@@ -53,7 +73,8 @@ def NN_train(data, model_name):
 
     combined_rnn.compile('adam', 'sparse_categorical_crossentropy')
 
-    print 'Training:'
+    logger = logging.getLogger('Train')
+    logger.info('Compiling the net')
     try:
         combined_rnn.fit([X_jets_train, X_photons_train], 
             y_train, batch_size=100, class_weight={

diff --git a/nn_with_modes.py b/nn_with_modes.py
@@ -0,0 +1,136 @@
+from keras.models import Sequential
+from keras.layers.core import Activation, Dense, Dropout
+from keras.layers import Masking, GRU, Merge, Input, merge
+from keras.callbacks import EarlyStopping, ModelCheckpoint
+import numpy as np
+import matplotlib
+import matplotlib.pyplot as plt
+import os
+
+def train(data, mode):
+	'''
+	Args:
+		data: an OrderedDict containing all X, y, w ndarrays for all particles (both train and test), e.g.:
+              data = {
+                "X_jet_train" : X_jet_train,
+                "X_jet_test" : X_jet_test,
+                "X_photon_train" : X_photon_train,
+                "X_photon_test" : X_photon_test,
+                "y_train" : y_train,
+                "y_test" : y_test,
+                "w_train" : w_train,
+                "w_test" : w_test
+              }
+        mode: a string specifying the type of task, either 'regression' or 'classification'
+    Returns:
+    	combine_rnn: a Sequential trained on data
+    '''
+
+	X_jet_train = data['X_jet_train']
+	X_photon_train = data['X_photon_train']
+	y_train = data['y_train']
+
+	jet_channel = Sequential()
+	photon_channel = Sequential()
+
+	JET_SHAPE = X_jet_train.shape[1:]
+	PHOTON_SHAPE = X_photon_train.shape[1:]
+
+	jet_channel.add(Masking(mask_value=-999, input_shape=JET_SHAPE, name='jet_masking'))
+	jet_channel.add(GRU(25, name='jet_gru'))
+	jet_channel.add(Dropout(0.3, name='jet_dropout'))
+
+	photon_channel.add(Masking(mask_value=-999, input_shape=PHOTON_SHAPE, name='photon_masking'))
+	photon_channel.add(GRU(10, name='photon_gru'))
+	photon_channel.add(Dropout(0.3, name='photon_dropout'))
+
+	combined_rnn = Sequential()
+	combined_rnn.add(Merge([jet_channel, photon_channel], mode='concat'))
+	combined_rnn.add(Dense(24, activation='relu'))
+	combined_rnn.add(Dropout(0.3))
+	combined_rnn.add(Dense(12, activation='relu'))
+	combined_rnn.add(Dropout(0.3))
+	if mode == 'classification':
+		combined_rnn.add(Dense(6, activation='softmax'))
+		combined_rnn.compile('adam', 'sparse_categorical_crossentropy')
+
+	elif mode == 'regression':
+		combined_rnn.add(Dense(1))
+		combined_rnn.compile('adam', 'mae')
+
+	try:
+		weights_path = os.path.join('weights', 'combinedrnn-progress.h5')
+		combined_rnn.load_weights(weights_path)
+	except IOError:
+		print 'Pre-trained weights not found'
+
+	print 'Training:'
+	try:
+		combined_rnn.fit([X_jet_train, X_photon_train], 
+    		y_train, batch_size=16, class_weight={
+                k : (float(len(y_train)) / float(len(np.unique(y_train)) * 
+                	(len(y_train[y_train == k])))) for k in np.unique(y_train)
+     		},
+        	callbacks = [
+            	EarlyStopping(verbose=True, patience=10, monitor='val_loss'),
+          		ModelCheckpoint(weights_path,
+          		monitor='val_loss', verbose=True, save_best_only=True)
+        	],
+    	nb_epoch=30, validation_split = 0.2) 
+
+	except KeyboardInterrupt:
+		print 'Training ended early.'
+
+	# -- load best weights back into the net
+	combined_rnn.load_weights(weights_path)
+
+	return combined_rnn
+
+def test(net, data):
+	'''
+	Args:
+		net: a Sequential instance trained on data
+		data: an OrderedDict containing all X, y, w ndarrays for all particles (both train and test), e.g.:
+              data = {
+                "X_jet_train" : X_jet_train,
+                "X_jet_test" : X_jet_test,
+                "X_photon_train" : X_photon_train,
+                "X_photon_test" : X_photon_test,
+                "y_train" : y_train,
+                "y_test" : y_test,
+                "w_train" : w_train,
+                "w_test" : w_test
+              }
+	Returns:
+		yhat_rnn: a numpy array containing the predicted values for each event
+				In the case of regression:
+				[[  28.82653809]
+ 				[ 332.62536621]
+ 				[ 343.72662354]
+ 				...,
+ 				[ 290.94213867]
+ 				[ 311.36965942]
+				[ 325.11975098]]
+
+ 				In the case of classification:
+				[[  2.98070186e-03   1.02684367e-03   6.20509265e-04   5.31344442e-04 
+				   4.20760407e-05   9.94798541e-01]
+ 				[  1.43380761e-01   2.02934369e-01   2.18192190e-01   2.09208429e-01
+    			   1.84640139e-01   4.16441038e-02]
+ 				[  1.91159040e-01   2.36048207e-01   2.16798335e-01   1.83185950e-01
+    			   1.12408176e-01   6.04002886e-02]
+				...,
+ 				[  8.16606451e-03   5.52139431e-02   1.69157043e-01   2.80651450e-01
+    			   3.87061536e-01   9.97499675e-02]
+ 				[  3.25843632e-01   2.48317569e-01   1.64540142e-01   1.18563063e-01
+    			   5.40928766e-02   8.86427015e-02]
+ 				[  3.07332397e-01   2.48623013e-01   1.71252742e-01   1.26610160e-01
+    			   6.08449057e-02   8.53367895e-02]]
+	'''
+	X_jet_test = data['X_jet_test']
+	X_photon_test = data['X_photon_test']
+	y_test= data ['y_test']
+
+	yhat_rnn = net.predict([X_jet_test, X_photon_test], verbose = True, batch_size = 512) 
+
+	return yhat_rnn
diff --git a/pipeline.py b/pipeline.py
@@ -1,14 +1,17 @@
 import json
 from data_processing import read_in, shuffle_split_scale, padding
+import numpy as np
 import pandautils as pup
 import cPickle
 from plotting import plot_inputs, plot_NN_class_placement_probability, save_roc_curves
 import utils
 import logging
-from nn_combined import NN_train
+from nn_all import train
 import deepdish.io as io
 #from plotting import plot_inputs, plot_performance
-
+from functional_nn import train, test
+from plotting import plot_inputs, plot_confusion, plot_regression#, plot_performance
+from nn_with_modes import train, test 
 
 def main(json_config, model_name, tree_name):
     '''
@@ -53,7 +56,7 @@ def sha(s):
         return m.hexdigest()[:5]
 
     #-- if the pickle exists, use it
-    pickle_name = 'processed_data_' + sha(config) + '.pkl'
+    pickle_name = 'processed_data_' + sha(config) + '_' + sha(mode) + '.pkl'
     try:
         logger.info('Attempting to read from {}'.format(pickle_name))
         data = cPickle.load(open(pickle_name, 'rb'))
@@ -63,7 +66,7 @@ def sha(s):
         logger.info('Pre-processed data not found in {}'.format(pickle_name))
         logger.info('Processing data')
         # -- transform ROOT files into standard ML format (ndarrays) 
-        X, y, w, le = read_in(class_files_dict, tree_name, particles_dict)
+        X, y, w, le = read_in(class_files_dict, tree_name, particles_dict, mode)
 
         # -- shuffle, split samples into train and test set, scale features
         data = shuffle_split_scale(X, y, w)  
@@ -105,11 +108,18 @@ def sha(s):
     # # use a validation split of 20%
     # # save out the weights to hdf5 and the model to yaml
     net=NN_train(data, model_name)
+    print data['X_electron_test']
+    print data['X_muon_test']
 
-    # # -- test
-    # # evaluate performance on the test set
-    yhat=net.predict([data['X_jet_test'], data['X_photon_test']], verbose = True, batch_size = 512) 
+    #yhat=net.predict([data['X_jet_test'], data['X_photon_test'], data], verbose = True, batch_size = 512) 
 
+    # # -- plot performance by mode
+    if mode == 'regression':
+        plot_regression(yhat, data)
+    if mode == 'classification':
+        plot_confusion(yhat, data)
+
+>>>>>>> 292a0d3357b00850bae9b432db74fd75ca906248
     # # -- plot performance
     #plot_NN(yhat, data)
 
@@ -128,9 +138,23 @@ def sha(s):
     # -- read in arguments
     parser = argparse.ArgumentParser()
     parser.add_argument('config', help="path to JSON file that specifies classes and corresponding ROOT files' paths")
+<<<<<<< HEAD
     parser.add_argument('model_name', help="name of the set from particular network")
+||||||| merged common ancestors
+=======
+    parser.add_argument('mode', help="classification or regression")
+>>>>>>> 292a0d3357b00850bae9b432db74fd75ca906248
     parser.add_argument('--tree', help="name of the tree to open in the ntuples", default='mini')
     args = parser.parse_args()
 
+    if args.mode != 'classification' and args.mode != 'regression':
+        raise ValueError('Mode must be classification or regression')
+
     # -- pass arguments to main
+<<<<<<< HEAD
     sys.exit(main(args.config, args.model_name, args.tree))
+||||||| merged common ancestors
+    sys.exit(main(args.config, args.tree))
+=======
+    sys.exit(main(args.config, args.mode, args.tree))
+>>>>>>> 292a0d3357b00850bae9b432db74fd75ca906248