feature: export experiment results (#2706)

d654eff4 · Tab Zhang · GitHub · bcefce6a · d654eff4 · d654eff4
Unverified Commit d654eff4 authored Aug 12, 2020 by Tab Zhang Committed by GitHub Aug 12, 2020
4 changed files
--- a/docs/en_US/Tutorial/Nnictl.md
+++ b/docs/en_US/Tutorial/Nnictl.md
@@ -462,13 +462,14 @@ Debug mode will disable version check function in Trialkeeper.
  |id|  False| |ID of the experiment    |
  |--filename, -f|  True| |File path of the output file     |
  |--type|  True| |Type of output file, only support "csv" and "json"|
+  |--intermediate, -i|False||Are intermediate results included|
  * Examples
  > export all trial data in an experiment as json format
  ```bash
-  nnictl experiment export [experiment_id] --filename [file_path] --type json
+  nnictl experiment export [experiment_id] --filename [file_path] --type json --intermediate
  ```
 * __nnictl experiment import__
@@ -903,4 +904,3 @@ Debug mode will disable version check function in Trialkeeper.
    ```bash
    nnictl --version
    ```
--- a/tools/nni_cmd/nnictl.py
+++ b/tools/nni_cmd/nnictl.py
@@ -140,6 +140,8 @@ def parse_args():
    parser_trial_export.add_argument('id', nargs='?', help='the id of experiment')
    parser_trial_export.add_argument('--type', '-t', choices=['json', 'csv'], required=True, dest='type', help='target file type')
    parser_trial_export.add_argument('--filename', '-f', required=True, dest='path', help='target file path')
+    parser_trial_export.add_argument('--intermediate', '-i', action='store_true',
+                                     default=False, help='are intermediate results included')
    parser_trial_export.set_defaults(func=export_trials_data)
    #save an NNI experiment
    parser_save_experiment = parser_experiment_subparsers.add_parser('save', help='save an experiment')

--- a/tools/nni_cmd/nnictl_utils.py
+++ b/tools/nni_cmd/nnictl_utils.py
@@ -16,7 +16,7 @@ from pyhdfs import HdfsClient
 from nni.package_utils import get_nni_installation_path
 from nni_annotation import expand_annotations
 from .rest_utils import rest_get, rest_delete, check_rest_server_quick, check_response
-from .url_utils import trial_jobs_url, experiment_url, trial_job_id_url, export_data_url
+from .url_utils import trial_jobs_url, experiment_url, trial_job_id_url, export_data_url, metric_data_url
 from .config_utils import Config, Experiments
 from .constants import NNICTL_HOME_DIR, NNI_HOME_DIR, EXPERIMENT_INFORMATION_FORMAT, EXPERIMENT_DETAIL_FORMAT, \
     EXPERIMENT_MONITOR_INFO, TRIAL_MONITOR_HEAD, TRIAL_MONITOR_CONTENT, TRIAL_MONITOR_TAIL, REST_TIME_OUT
@@ -681,30 +681,51 @@ def monitor_experiment(args):
    set_monitor(False, args.time)
 def export_trials_data(args):
-    '''export experiment metadata to csv
+    '''export experiment metadata and intermediate results to json or csv
    '''
+    def groupby_trial_id(intermediate_results):
+        sorted(intermediate_results, key=lambda x: x['timestamp'])
+        groupby = dict()
+        for content in intermediate_results:
+            groupby.setdefault(content['trialJobId'], []).append(json.loads(content['data']))
+        return groupby
    nni_config = Config(get_config_filename(args))
    rest_port = nni_config.get_config('restServerPort')
    rest_pid = nni_config.get_config('restServerPid')
    if not detect_process(rest_pid):
        print_error('Experiment is not running...')
        return
    running, response = check_rest_server_quick(rest_port)
-    if running:
+    if not running:
+        print_error('Restful server is not running')
+        return
    response = rest_get(export_data_url(rest_port), 20)
    if response is not None and check_response(response):
+        content = json.loads(response.text)
+        if args.intermediate:
+            intermediate_results_response = rest_get(metric_data_url(rest_port), REST_TIME_OUT)
+            if not intermediate_results_response or not check_response(intermediate_results_response):
+                print_error('Error getting intermediate results.')
+                return
+            intermediate_results = groupby_trial_id(json.loads(intermediate_results_response.text))
+            for record in content:
+                record['intermediate'] = intermediate_results[record['id']]
        if args.type == 'json':
            with open(args.path, 'w') as file:
-                    file.write(response.text)
+                file.write(json.dumps(content))
        elif args.type == 'csv':
-                content = json.loads(response.text)
            trial_records = []
            for record in content:
+                formated_record = dict()
+                if args.intermediate:
+                    formated_record['intermediate'] = '[' + ','.join(record['intermediate']) + ']'
                record_value = json.loads(record['value'])
                if not isinstance(record_value, (float, int)):
-                        formated_record = {**record['parameter'], **record_value, **{'id': record['id']}}
+                    formated_record.update({**record['parameter'], **record_value, **{'id': record['id']}})
                else:
-                        formated_record = {**record['parameter'], **{'reward': record_value, 'id': record['id']}}
+                    formated_record.update({**record['parameter'], **{'reward': record_value, 'id': record['id']}})
                trial_records.append(formated_record)
            if not trial_records:
                print_error('No trial results collected! Please check your trial log...')
@@ -715,11 +736,9 @@ def export_trials_data(args):
                writer.writerows(trial_records)
        else:
            print_error('Unknown type: %s' % args.type)
-                exit(1)
+            return
    else:
        print_error('Export failed...')
-    else:
-        print_error('Restful server is not Running')
 def search_space_auto_gen(args):
    '''dry run trial code to generate search space file'''
@@ -898,3 +917,4 @@ def load_experiment(args):
    # Step6. Cleanup temp data
    shutil.rmtree(temp_root_dir)
--- a/tools/nni_cmd/url_utils.py
+++ b/tools/nni_cmd/url_utils.py
@@ -22,6 +22,12 @@ EXPORT_DATA_API = '/export-data'
 TENSORBOARD_API = '/tensorboard'
+METRIC_DATA_API = '/metric-data'
+def metric_data_url(port):
+    '''get metric_data url'''
+    return '{0}:{1}{2}{3}'.format(BASE_URL, port, API_ROOT_URL, METRIC_DATA_API)
 def check_status_url(port):
    '''get check_status url'''