Optuna: 一个超参数优化框架

Optuna 是一个自动超参数优化软件框架，特别为机器学习设计。它具有命令式的、define-by-run 风格的用户 API。得益于我们的 define-by-run API，用 Optuna 编写的代码具有高度的模块化，Optuna 用户可以动态地构建超参数的搜索空间。

主要特性

Optuna 具有以下现代化功能：

轻量级、多功能且平台无关的架构
- 通过简单的安装和很少的依赖项来处理各种任务。
Pythonic 搜索空间
- 使用熟悉的 Python 语法定义搜索空间，包括条件和循环。
高效的优化算法
- 采用最先进的算法来采样超参数并有效地剪枝无希望的 trial。
易于并行化
- 通过对代码进行很少或不进行更改，即可将研究扩展到数十或数百个 worker。
快速可视化
- 通过各种绘图函数检查优化历史。

基本概念

我们如下使用术语 study 和 trial：

Study: 基于目标函数的优化
Trial: 目标函数的单次执行

请参考下面的示例代码。study 的目标是通过多次 trial（例如，n_trials=100）找出最佳的超参数值集合（例如，classifier 和 svm_c）。Optuna 是一个为自动化和加速优化 study 而设计的框架。

import ...

# Define an objective function to be minimized.
def objective(trial):

    # Invoke suggest methods of a Trial object to generate hyperparameters.
    regressor_name = trial.suggest_categorical('classifier', ['SVR', 'RandomForest'])
    if regressor_name == 'SVR':
        svr_c = trial.suggest_float('svr_c', 1e-10, 1e10, log=True)
        regressor_obj = sklearn.svm.SVR(C=svr_c)
    else:
        rf_max_depth = trial.suggest_int('rf_max_depth', 2, 32)
        regressor_obj = sklearn.ensemble.RandomForestRegressor(max_depth=rf_max_depth)

    X, y = sklearn.datasets.fetch_california_housing(return_X_y=True)
    X_train, X_val, y_train, y_val = sklearn.model_selection.train_test_split(X, y, random_state=0)

    regressor_obj.fit(X_train, y_train)
    y_pred = regressor_obj.predict(X_val)

    error = sklearn.metrics.mean_squared_error(y_val, y_pred)

    return error  # An objective value linked with the Trial object.

study = optuna.create_study()  # Create a new study.
study.optimize(objective, n_trials=100)  # Invoke optimization of the objective function.

Web Dashboard

Optuna Dashboard 是 Optuna 的实时 Web Dashboard。您可以通过图表和表格查看优化历史、超参数重要性等。您无需创建 Python 脚本即可调用 Optuna 的可视化功能。欢迎功能请求和错误报告！

https://user-images.githubusercontent.com/5564044/204975098-95c2cb8c-0fb5-4388-abc4-da32f56cb4e5.gif

optuna-dashboard 可通过 pip 安装

$ pip install optuna-dashboard

提示

请查看 Optuna Dashboard 官方文档的入门部分。

OptunaHub

OptunaHub 是 Optuna 的功能共享平台。您可以使用的注册功能并发布您的软件包。有关更多详细信息，请参阅官方文档。

optunahub 可通过 pip 安装

$ pip install optunahub

沟通

有关问题，请访问 GitHub Discussions。
有关错误报告和功能请求，请访问 GitHub Issues。

贡献

欢迎任何对 Optuna 的贡献！当您发送 pull request 时，请遵循贡献指南。

许可证

MIT 许可证（请参阅 LICENSE）。

Optuna 使用来自 SciPy 和 fdlibm 项目的代码（请参阅第三方许可证）。

参考文献

Takuya Akiba, Shotaro Sano, Toshihiko Yanase, Takeru Ohta, and Masanori Koyama. 2019. Optuna: A Next-generation Hyperparameter Optimization Framework. In KDD (arXiv)。