top of page
Blog
検索


バグではないけど寄っちゃってるログの真正性を検証する指標を作ったら、「差別の要件」を定義してしまった話
AI企業のRLHFアノテーション制度において、低賃金労働者が「rude」「indirect」「elitist」等の主観的ラベルを発話に付与し、その判定が出力品質を差別的に変動させている構造を、原理的判定不能性の観点から解明。評価制度成立の必須条件である評価者間一致が、文化差・個人差・偏見保有により構造的に成立せず、現状のラベリングは「評価」ではなく「アノテーターの感想」であることを実証。判定能力とコミュニケーション能力の構造的非両立を示し、判定職に従事可能な人材プールが「裁きたい欲求を持つ層」に偏ることで、AI出力品質に「コミュニケーション能力欠如者の発話特性」が混入する経路を解明。
代替案として、発話を内容軸・表現軸・機能軸・結果軸の4軸で評価する指標体系を提案。各軸内で26カテゴリの暫定分類を行い、ログを精査するAIによる自動タグ付けを実装することで、人間アノテーターを大幅削減し、企業の黒字化と社会的誠実性を両立する設計を提示。これによりレビュアー職の意味を「人を裁く」から「ラベルが必要とされた意味を考える」に転換し、差別の自動化装置を構造

Viorazu.
5月3日読了時間: 40分
bottom of page