add uni and multi clf bench

aimclub · Dec 19, 2023 · e713d9a · e713d9a
1 parent 4f1213d
commit e713d9a
Show file tree

Hide file tree

Showing 6 changed files with 292 additions and 406 deletions.
diff --git a/benchmark/benchmark_TSC.py b/benchmark/benchmark_TSC.py
@@ -1,254 +1,69 @@
 import logging
 import os
-import random
 from abc import ABC
-from typing import Union
+from copy import deepcopy
 
 import pandas as pd
-import seaborn as sns
-from matplotlib import pyplot as plt
 
 from benchmark.abstract_bench import AbstractBenchmark
-from fedot_ind.api.main import FedotIndustrial
-from fedot_ind.api.utils.metafeatures import MetaFeaturesDetector
+from fedot_ind.api.utils.path_lib import PROJECT_PATH
 from fedot_ind.core.architecture.postprocessing.results_picker import ResultsPicker
-from fedot_ind.tools.loader import DataLoader
+from fedot_ind.core.metrics.metrics_implementation import Accuracy
+from fedot_ind.core.repository.constanst_repository import MULTI_CLF_BENCH, UNI_CLF_BENCH
 
 
 class BenchmarkTSC(AbstractBenchmark, ABC):
     def __init__(self,
-                 number_of_datasets: int = 5,
-                 random_selection: bool = False,
-                 custom_datasets: Union[list, bool] = False,
+                 experiment_setup: dict = None,
+                 custom_datasets: list = None,
                  use_small_datasets: bool = False):
-        
+
         super(BenchmarkTSC, self).__init__(
-            output_dir='./tsc/benchmark_results',
-            random_selection=random_selection,
-            number_of_datasets=number_of_datasets)
+            output_dir='./tser/benchmark_results')
 
         self.logger = logging.getLogger(self.__class__.__name__)
 
-        self._create_output_dir()
-        self.number_of_datasets = number_of_datasets
-        self.random_selection = random_selection
-        self.custom_datasets = custom_datasets
-        self.use_small_datasets = use_small_datasets
+        # self._create_output_dir()
+        self.experiment_setup = experiment_setup
+        self.multi_TSC = MULTI_CLF_BENCH
+        self.uni_TSC = UNI_CLF_BENCH
+        if custom_datasets is None:
+            if use_small_datasets:
+                self.custom_datasets = self.uni_TSC
+            else:
+                self.custom_datasets = self.multi_TSC
+        else:
+            self.custom_datasets = custom_datasets
 
+        if use_small_datasets:
+            self.path_to_result = '/benchmark/results/time_series_uni_clf_comparasion.csv'
+        else:
+            self.path_to_result = '/benchmark/results/time_series_multi_clf_comparasion.csv'
         self.results_picker = ResultsPicker(path=os.path.abspath(self.output_dir))
-        self.generators = [
-            # 'spectral',
-            'quantile',
-            # 'wavelet',
-            'topological',
-            #                'window_quantile', 'window_spectral', 'recurrence'
-        ]
 
     def run(self):
         self.logger.info('Benchmark test started')
-        # dataset_list, types = self._get_dataset_list(n_samples=self.number_of_datasets)
-        dataset_list = ['ItalyPowerDemand', 'UMD']
-        if self.custom_datasets:
-            dataset_list = dataset_list.extend(self.custom_datasets)
-
-        for dataset_name in dataset_list:
-            for generator in self.generators:
-                self.logger.info(f'Run benchmark for {dataset_name} with {generator}')
-                config = dict(task='ts_classification',
-                              dataset=dataset_name,
-                              feature_generator=generator,
-                              use_cache=False,
-                              error_correction=False,
-                              launches=1,
-                              timeout=1,
-                              n_jobs=2,
-                              window_sizes='auto')
-
-                indus = FedotIndustrial(input_config=config, output_folder=self.output_dir)
-                train_data, test_data, _ = indus.reader.read(dataset_name=dataset_name)
-                indus.fit(train_features=train_data[0], train_target=train_data[1])
-
-                labels = indus.predict(test_features=test_data[0])
-                probs = indus.predict_proba(test_features=test_data[0])
-                metrics = indus.get_metrics(target=test_data[1],
-                                            metric_names=['f1', 'roc_auc', 'accuracy', 'logloss', 'precision'])
-
-                for predict in (labels, probs):
-                    indus.save_predict(predicted_data=predict)
-
-                indus.save_metrics(metrics=metrics)
-
         basic_results = self.load_local_basic_results()
-        basic_path = os.path.join(self.output_dir, 'basic_metrics_report.csv')
-        basic_results.to_csv(basic_path, index=False)
-
+        metric_dict = {}
+        for dataset_name in self.custom_datasets:
+            experiment_setup = deepcopy(self.experiment_setup)
+            prediction, target = self.evaluate_loop(dataset_name, experiment_setup)
+            metric = Accuracy(target, prediction).metric()
+            metric_dict.update({dataset_name: metric})
+            basic_results.loc[dataset_name, 'Fedot_Industrial'] = metric
+            dataset_path = os.path.join(self.experiment_setup['output_folder'], f'{dataset_name}', 'metrics_report.csv')
+            basic_results.to_csv(dataset_path)
+        basic_path = os.path.join(self.experiment_setup['output_folder'], 'comprasion_metrics_report.csv')
+        basic_results.to_csv(basic_path)
         self.logger.info("Benchmark test finished")
 
-    def _get_dataset_list(self, n_samples):
-        all_datasets = self.results_picker.get_datasets_info()
-        dataset_list = self.stratified_ds_selection(all_datasets, n_samples)
-        types = []
-        for ds in dataset_list:
-            types.append(all_datasets[all_datasets['dataset'] == ds]['type'].values[0])
-
-        return dataset_list, types
-
-    def load_local_basic_results(self):
-        return self.results_picker.run(get_metrics_df=True, add_info=True)
-
-    def _fill_na_metafeatures(self, basic_metrics_report: pd.DataFrame):
-        """ Fill missing meta-data about datasets
-
-        Args:
-            basic_metrics_report: report with basic metrics
-
-        """
-        if basic_metrics_report is None:
-            return None
-
-        datasets_with_na = basic_metrics_report[basic_metrics_report.isnull().any(axis=1)]['dataset'].unique()
-        for dataset in datasets_with_na:
-            train_data, test_data = DataLoader(dataset).load_data()
-            detector = MetaFeaturesDetector(train_data=train_data, test_data=test_data, dataset_name=dataset)
-            base_meta_features = detector.get_base_metafeatures()
-
-            index_of_na = basic_metrics_report[basic_metrics_report['dataset'] == dataset].index.tolist()
-            for ind in index_of_na:
-                for key, value in base_meta_features.items():
-                    basic_metrics_report.loc[ind, key] = value
-
-        return basic_metrics_report
-
-    def _get_basic_results_table(self, experiment_results):
-        basic_result_df = pd.DataFrame()
-        for dataset in experiment_results.keys():
-            try:
-                for generator in experiment_results[dataset]['Original']:
-                    for launch in experiment_results[dataset]['Original'][generator].keys():
-                        metrics = experiment_results[dataset]['Original'][generator][launch]['metrics']
-                        basic_result_df = basic_result_df.append(
-                            {'dataset': dataset, 'experiment': generator, 'f1': metrics['f1'],
-                             'roc_auc': metrics['roc_auc'], 'accuracy': metrics['accuracy'],
-                             'precision': metrics['precision'], 'logloss': metrics['logloss']},
-                            ignore_index=True)
-            except TypeError:
-                continue
-
-        # Ensure that `dataset` and `experiment` columns are the first two columns
-        cols = basic_result_df.columns.tolist()
-        cols.pop(cols.index('dataset'))
-        cols.pop(cols.index('experiment'))
-        metrics_df = basic_result_df[['dataset', 'experiment'] + cols]
-        return metrics_df
-
-    def _get_ensemble_results_table(self, experiment_results):
-
-        # with open('ensemble_report_example.pickle', 'rb') as handle:
-        #     ensemble_df = pickle.load(handle)
-        #     # ensemble_df = ensemble_df.reset_index()
-        #     # cols = list(ensemble_df.columns)
-        #     # cols[0] = 'dataset'
-        #     # ensemble_df.columns = cols
-        # return ensemble_df
-
-        ensemble_path = os.path.join(self.output_dir, 'ensemble')
-        if os.path.exists(ensemble_path):
-            files = self.results_picker.list_files(ensemble_path)
-            ls = [pd.read_csv(os.path.join(ensemble_path, files[0]), index_col=0) for file in files]
-
+    def load_local_basic_results(self, path: str = None):
+        if path is None:
+            path = PROJECT_PATH + self.path_to_result
+            results = pd.read_csv(path, sep=';', index_col=0)
+            results = results.dropna(axis=1, how='all')
+            results = results.dropna(axis=0, how='all')
+            self.experiment_setup['output_folder'] = PROJECT_PATH + '/benchmark/results/ts_classification'
+            return results
         else:
-            self.logger.info('No ensemble results found')
-            return None
-
-        return pd.concat(ls, ignore_index=True)
-
-    def basic_analysis(self, report: pd.DataFrame, save_locally: bool = False):
-        data_binary = report[report['number_of_classes'] == 2].reset_index(drop=True)
-        data_multi = report[report['number_of_classes'] > 2].reset_index(drop=True)
-
-        self.get_catplot(data_binary, 'roc_auc', save_fig=save_locally)
-        self.get_catplot(data_multi, 'f1', save_fig=save_locally)
-
-    def ensemble_analysis(self, ensemble_report, save_locally):
-        """
-        Now just a plug before I figure out how to analyze ensemble results
-
-        Args:
-            ensemble_report: report with ensemble results
-            save_locally: save plots locally
-
-        Returns:
-
-        """
-        if save_locally and ensemble_report is not None:
-            return ensemble_report
-
-    @staticmethod
-    def get_catplot(dataset: pd.DataFrame, metric: str, save_fig: bool = False):
-        sns.set(font_scale=1.5)
-        g = sns.catplot(
-            data=dataset,
-            kind="bar",
-            x="experiment", y=metric, hue="type",
-            palette="tab10", alpha=.6, height=5, aspect=2)
-        g.despine(left=True)
-        g.set_axis_labels("", metric)
-        g.legend.set_title("")
-        g.fig.suptitle(f'Average {metric.upper()} by experiment type',
-                       fontsize=14,
-                       )
-        if save_fig:
-            g.savefig(f'./tsc/benchmark_results/{metric}.png')
-
-        plt.show()
-
-    def stratified_ds_selection(self, all_datasets_table: pd.DataFrame, n_samples: int = 5):
-        """
-        Selects n_samples datasets from each type
-        Args:
-            all_datasets_table: pd.DataFrame with all datasets info (from results_picker)
-            n_samples: number of datasets to select from each type
-
-        Returns:
-            list of selected datasets names
-
-        """
-        univariate_tss = all_datasets_table[all_datasets_table['multivariate_flag'] == 0]
-
-        if self.use_small_datasets:
-            univariate_tss = univariate_tss[(univariate_tss['train_size'] < 1000) &
-                                            (univariate_tss['length'] < 1000) &
-                                            (univariate_tss['test_size'] < 1000)]
-
-        filtered_by_type_quantity = univariate_tss.groupby('type')['type'].count() >= n_samples
-        filtered_types = filtered_by_type_quantity[filtered_by_type_quantity].index.tolist()
-
-        univariate_tss = univariate_tss[univariate_tss['type'].isin(filtered_types)]
-
-        if self.random_selection:
-            rst = random.randint(0, len(univariate_tss) - 1)
-        else:
-            rst = 42
-
-        univariate_tss = univariate_tss.groupby('type', group_keys=False).apply(lambda x: x.sample(n_samples,
-                                                                                                   random_state=rst))
-
-        return univariate_tss['dataset'].tolist()
-
-    def _add_custom_datasets(self, experiment_config):
-        for ds in self.custom_datasets:
-            experiment_config['datasets_list'].append(ds)
-        self.logger.info(f'Custom datasets added: {self.custom_datasets}')
-        return experiment_config
-
-
-if __name__ == "__main__":
-    datasets_selection_config = {
-        'use_small_datasets': True,
-        'random_selection': True,
-        'custom_datasets': False,  # or list ['Lightning7_fake'] for example
-        'number_of_datasets': 2
-    }
-
-    bnch = BenchmarkTSC(**datasets_selection_config)
-    bnch.run()
+            return self.results_picker.run(get_metrics_df=True, add_info=True)
diff --git a/benchmark/benchmark_TSER.py b/benchmark/benchmark_TSER.py
@@ -9,6 +9,7 @@
 from fedot_ind.core.metrics.metrics_implementation import RMSE
 from benchmark.abstract_bench import AbstractBenchmark
 from fedot_ind.core.architecture.postprocessing.results_picker import ResultsPicker
+from fedot_ind.core.repository.constanst_repository import MULTI_REG_BENCH
 
 
 class BenchmarkTSER(AbstractBenchmark, ABC):
@@ -24,27 +25,7 @@ def __init__(self,
 
         # self._create_output_dir()
         self.experiment_setup = experiment_setup
-        self.monash_regression = [
-            "AppliancesEnergy",
-            "AustraliaRainfall",
-            "BeijingPM10Quality",
-            "BeijingPM25Quality",
-            "BenzeneConcentration",
-            "BIDMC32HR",
-            "BIDMC32RR",
-            "BIDMC32SpO2",
-            "Covid3Month",
-            "FloodModeling1",
-            "FloodModeling2",
-            "FloodModeling3",
-            "HouseholdPowerConsumption1",
-            "HouseholdPowerConsumption2",
-            "IEEEPPG",
-            "LiveFuelMoistureContent",
-            "NewsHeadlineSentiment",
-            "NewsTitleSentiment",
-            "PPGDalia",
-        ]
+        self.monash_regression = MULTI_REG_BENCH
         if custom_datasets is None:
             self.custom_datasets = self.monash_regression
         else: