核心概念
モバイルキーボード「SwiftKey」にオンデバイス絵文字分類器を実装するために、GPTを用いたデータ拡張による精度向上とユーザーの利用履歴に基づいた出力調整を行い、メモリ消費とレイテンシを抑制しつつ、正確な絵文字予測を実現した。
要約
研究の概要
本論文は、モバイルキーボード「SwiftKey」にオンデバイス絵文字分類器を実装した研究について述べています。オンデバイスでの制約(メモリ消費とレイテンシの抑制)を満たしつつ、正確な絵文字予測を実現するために、GPTを用いたデータ拡張による精度向上とユーザーの利用履歴に基づいた出力調整が行われました。
研究の背景
- 絵文字はコミュニケーションの質を向上させることから、モバイルキーボードにおける入力メッセージの意図を表現する絵文字の予測は重要な機能となっています。
- 絵文字分類には、出力の種類の多さ、文脈依存性、ユーザー依存性、データセットの偏りといった課題が存在します。
データ拡張による精度向上
- 絵文字データセットの偏りを軽減するために、GPT-3.5 turboを用いて、合成例によってトレーニングデータを拡張しました。
- 絵文字をテキスト表現に翻訳し、GPTを用いてそのテキストを含む文章を生成することで、データの偏りを軽減しました。
ユーザーの利用履歴に基づいた出力調整
- ユーザーの好みの絵文字を考慮するために、絵文字分類器の出力確率分布を、ユーザーの好みの絵文字の確率分布に基づいて再ランク付けしました。
- これにより、文脈だけでなくユーザーの好みも考慮した絵文字予測が可能になりました。
実験と結果
- 3種類のデータセットを用いて、提案手法の有効性を検証しました。
- GPTを用いたデータ拡張により、特に出現頻度の低い絵文字の予測精度が向上しました。
- ユーザーの利用履歴に基づいた出力調整により、予測精度がさらに向上しました。
- レイテンシは許容範囲内であり、メモリ消費も抑制されました。
ライブ実験
- SwiftKeyのAndroidユーザーを対象にライブ実験を実施しました。
- ベースラインと比較して、提案手法はCTR、外部絵文字レート、精度がそれぞれ12%、0.7%、4%向上しました。
結論
- 提案されたオンデバイス絵文字分類器は、GPTを用いたデータ拡張とユーザーの利用履歴に基づいた出力調整により、メモリ消費とレイテンシを抑制しつつ、正確な絵文字予測を実現しました。
- 今後の課題として、複数の絵文字の予測や、他の言語への対応などが挙げられます。
統計
90種類の絵文字を使用したモデルでは、ユーザーが使用する一般的な絵文字のすべてが含まれているわけではないため、CTRが7%低下した。
590種類の絵文字を使用したモデルと1090種類の絵文字を使用したモデルを比較したところ、1090種類のモデルでは、より稀な絵文字が含まれているため、CTRが0.3%向上した。
1090種類の絵文字を使用したモデルでは、ベースラインと比較して、CTR、外部絵文字レート、精度がそれぞれ12%、0.7%、4%向上した。
引用
"Emojis improve communication quality among smart-phone users in different text applications."
"This paper proposes an on-device emoji classifier trained with a new data augmentation method based on GPT that accounts for imbalanced emoji dataset distribution in numerous emoji classes."
"Results show that the proposed on-device emoji classifier deployed for SwiftKey increases the accuracy performance of emoji prediction particularly on rare emojis and emoji engagement."