Microsoftがスプレッドシートを理解できる言語モデル「SpreadsheetLLM」を発表、Excelの仕事もAIがこなす時代に
表計算ソフトのスプレッドシートは、広大な表や多種多様な書式設定、複雑な計算式や参照などの要素を持っており、大規模言語モデル(LLM)にとっては鬼門です。Microsoftの研究者らが、ExcelやGoogleスプレッドシートのような従来のAIでは理解が難しいスプレッドシートの処理を念頭に置いた言語モデルの「SpreadsheetLLM」を発表しました。
[2407.09025] SpreadsheetLLM: Encoding Spreadsheets for Large Language Models
https://arxiv.org/abs/2407.09025
Microsoft's new AI system 'SpreadsheetLLM' unlocks insights from spreadsheets, boosting enterprise productivity | VentureBeat
https://venturebeat.com/ai/microsofts-new-ai-system-spreadsheetllm-unlocks-insights-from-spreadsheets-boosting-enterprise-productivity/
Microsoft's experimental SpreadsheetLLM helps AI better understand spreadsheets - SiliconANGLE
https://siliconangle.com/2024/07/15/microsofts-experimental-spreadsheetllm-helps-ai-better-understand-spreadsheets/
2024年7月12日にプレプリントサーバー・arXivに掲載された論文で、Microsoftの研究チームは、スプレッドシートを言語モデルでも理解しやすい形式に変換するアプローチを採用した「SpreadsheetLLM」を発表しました。
このアプローチでは、研究チームが開発した「SheetCompressor」がスプレッドシートをエンコードして圧縮し、言語モデルが理解したり分析したりしやすいデータに変換します。これにより、GPT-4やLlama 2のようなさまざまなLLMがスプレッドシートをより深く理解できるようになり、例えばGPT-4はテーブル検出テストで78.9%のスコアを出し、既存のアプローチより12.3%優れた成績を収めました。
SheetCompressorは、表構造を定義する重要な行や列を特定する「効率的なレイアウト理解のための構造的アンカー」、空ではないセルのテキストにインデックスを付けてデータの整合性を保ちながらトークンの使用を最適化する「トークンの効率化のための転置インデックス翻訳」、同様の形式や数値のセルをグループ化して使用するトークンを低減させる「数値セルのデータフォーマット集計」の3つのコンポーネントから成ります。
研究チームによると、SheetCompressorを使うとデータが最大96%圧縮されるため、これによりLLMがトークンの制限内で大規模なデータセットを処理できるようになるとのこと。
SpreadsheetLLMの強みは、スプレッドシートのデータへのアクセス性を改善し、より理解しやすいものにできることです。LLMの力により、ユーザーは複雑な数式やプログラミング言語ではなく自然言語処理でスプレッドシートを参照したり作成したりできるため、例えば組織内のより多くの個人がデータに基づく意思決定をしやすくなるといったメリットが見込めます。
また、SpreadsheetLLMはデータのクリーニングやフォーマット、集計などスプレッドシートのデータ分析にかかるやっかいな作業の多くを自動化できるので、企業の従業員はより価値の高い仕事に充てるリソースを増やすことができます。
Microsoftは、既にMicrosoft 365 Copilotのような製品でオフィススイートとAIの統合を進めており、SpreadsheetLLMの登場によりスプレッドシートでもAIが活用できるようになる可能性が出てきました。
SpreadsheetLLMが正式にリリースされるかどうかやその時期は不明ですが、IT系ニュースサイトのVentureBeatは「SpreadsheetLLMが研究から実際に使えるアプリケーションに移行した時に、スプレッドシートでの作業がどのように変化し、企業におけるデータ主導の意思決定にどんな可能性がもたらされるのかを見るのが楽しみです。MicrosoftがこのAI主導のイノベーションの最前線に立つことで、特にExcelとスプレッドシートを中心とした仕事の未来はこれまで以上に明るくなりそうです」とコメントしました。
07/16 17:00
GIGAZINE