Hola, el curso Machine Learning con Oracle ADS: productividad en la creación de modelos en la clase 2. Explorando Oracle AutoML esta desactualizado y si se ejecutan los pasos del video no funciona nada. La solución que he encontrado es:
1.- Cambiar de kernel al kernel llamado Oracle AutoML and Model Explanation for Python 3.8. Instalarlo y cambiar de kernel en el notebook utilizado en el curso. En este kernel ya esta instalada la librería automl la cual genera problemas al ejecutar el código:
oracle_automl=AutoML(ads_data)
Si se ejecuta la línea de código anterior, se muestra el siguiente error:
ERROR - Exception Traceback (most recent call last): File "/home/datascience/conda/automlx_p38_cpu_v5/lib/python3.8/site-packages/IPython/core/interactiveshell.py", line 3398, in run_code exec(code_obj, self.user_global_ns, self.user_ns) File "/tmp/ipykernel_5558/3054559234.py", line 1, in <cell line: 1> oracle_automl=AutoML(ads_data) File "/home/datascience/conda/automlx_p38_cpu_v5/lib/python3.8/site-packages/ads/common/decorator/deprecate.py", line 62, in wrapper raise NotSupportedError(msg) ads.common.decorator.deprecate.NotSupportedError: Working with AutoML has moved from within ADS to working directly with the AutoMLx library. AutoMLx are preinstalled in conda pack automlx_p38_cpu_v2 and later, and can now be updated independently of ADS. AutoMLx documentation may be found at https://docs.oracle.com/en-us/iaas/tools/automlx/latest/html/multiversion/v23.1.1/index.html. Notebook examples are in Oracle's samples repository: https://github.com/oracle-samples/oci-data-science-ai-samples/tree/master/notebook_examples and a migration tutorial can be found at https://accelerated-data-science.readthedocs.io/en/latest/user_guide/model_training/automl/quick_start.html . NotSupportedError: Working with AutoML has moved from within ADS to working directly with the AutoMLx library. AutoMLx are preinstalled in conda pack automlx_p38_cpu_v2 and later, and can now be updated independently of ADS. AutoMLx documentation may be found at https://docs.oracle.com/en-us/iaas/tools/automlx/latest/html/multiversion/v23.1.1/index.html. Notebook examples are in Oracle's samples repository: https://github.com/oracle-samples/oci-data-science-ai-samples/tree/master/notebook_examples and a migration tutorial can be found at https://accelerated-data-science.readthedocs.io/en/latest/user_guide/model_training/automl/quick_start.html .
En el sitio web https://docs.oracle.com/en-us/iaas/tools/automlx/latest/html/multiversion/v23.1.1/index.html se encuentra la documentación para usar AutoMLx.
2.- Crear una pipeline. En esta pipeline existen algunos parámetros que utiliza el instructor en el curso:
modelo = automl.Pipeline(task='classification',score_metric='accuracy',model_list=['DecisionTreeClassifier','SVC','LogisticRegression','RandomForestClassifier'])
3.- Utilización de método fit. Aquí va el resto de parámetros utilizados por el instructor:
modelo.fit(train.X,train.y,time_budget = 150)
4.- En la pipeline existe el método print_trials y muestra un listado de modelos y métricas:
modelo.print_trials(max_rows=20,sort_column='Mean Validation Score')
5.- El modelo seleccionado se puede obtener con el siguiente atributo:
modelo.selected_model_
6.- Las features seleccionadas se pueden obtener usando el siguiente atributo:
modelo.selected_features_names_
Espero que mi contribución sea de ayuda para terminar este curso ya que ha cambiado cómo usar automl desde oracle. Saludos,