本記事では、Agodaにおけるメール自動分類の取り組みについて説明しています。
Agodaでは、毎日約50,000通のサプライヤーや顧客からのメールを受け取っており、これらのメールを効率的に分類することが重要です。GPTモデルを活用することで、メールを特定のクラスに分類することができるようになりましたが、高精度を達成するためには適切なデータセットの準備が課題となっていました。
そこで、Customer Experience Group (CEG) Automationチームは、コサイン類似度を活用することで、GPTモデルの微調整に必要なデータセットサイズを最小限に抑える手法を開発しました。具体的には、各クラスの理想的な表現ベクトルを作成し、クラス間の類似度を計算することで、必要最小限のデータセットサイズを見積もることができます。
この手法を実際のキャンセル料免除リクエストの分類タスクに適用した結果、データセットサイズを最大30%削減できることが分かりました。これにより、QA工数の大幅な削減が可能となり、迅速なデジタルコミュニケーションの自動化に貢献できると期待されます。
إلى لغة أخرى
من محتوى المصدر
medium.com
الرؤى الأساسية المستخلصة من
by Agoda Engine... في medium.com 05-07-2024
https://medium.com/agoda-engineering/how-we-leverage-cosine-similarity-for-fine-tuning-dataset-estimation-bba361703365استفسارات أعمق