RLHF(読み)アールエルエッチエフ(英語表記)RLHF

デジタル大辞泉 「RLHF」の意味・読み・例文・類語

アール‐エル‐エッチ‐エフ【RLHF】[reinforcement learning from human feedback]

reinforcement learning from human feedback機械学習において、人間からのフィードバックを用いて強化学習をすること。また、そのような学習モデル。人間による実際評価を出力結果に反映させることで、対話型AIなどで不適切な質問を拒否するようにしたり、学習データに潜在する差別などのバイアスを除去したりする調整を行う。

出典 小学館デジタル大辞泉について 情報 | 凡例

今日のキーワード

プラチナキャリア

年齢を問わず、多様なキャリア形成で活躍する働き方。企業には専門人材の育成支援やリスキリング(学び直し)の機会提供、女性活躍推進や従業員と役員の接点拡大などが求められる。人材の確保につながり、従業員を...

プラチナキャリアの用語解説を読む

コトバンク for iPhone

コトバンク for Android