データ分析に必須のExcelの基本的な関数をまとめたチートシートを通して、データ分析の基礎力を習得する方法を紹介している。
複数の視覚的および言語的要約を組み合わせることで、金融詐欺分析の効率と正確性を向上させる。
デバイスとブラウザの組み合わせに基づいて、コストパークリックの変化の主な要因を特定する。
映画史上最高の俳優を統計的に分析し、その評価基準と結果を明らかにする。
真犯罪メディアは人々の強い関心を集めている。その理由は複雑で、単純な好奇心以上のものがある。
時系列データ分析においては、モデル設計の改善だけでなく、データの質の向上が重要である。本論文では、時系列データの特性に基づいて、サンプル、特徴量、期間の観点からデータ選択方法を体系的にレビューし、その特徴、利点、課題を議論する。
LLMの高度な理解力と生成能力を活用し、テキスト以外のデータ(表形式、画像など)においても効率的に類似データポイントを特定する手法を提案する。
データストリームにおける量子化推定の問題に対して、比較モデルを超えた最適な解法を提示する。従来の量子化推定アルゴリズムは比較モデルに最適化されていたが、本研究では整数ユニバースを活用することで、より効率的な量子化推定アルゴリズムを実現する。
大規模な半構造化データに対するクエリ言語であるKustoクエリを、自然言語から自動的に生成する革新的なフレームワークを提案する。
大規模言語モデルを活用したデータ分析では、会話の中に埋め込まれた様々なコンテキスト(コード、可視化、自然言語説明など)から洞察を自動的に抽出し、関連付け、整理することが重要である。