AIのアプリ実装方法を学ぶ「Microsoft AI Days Japan 2018 for partners」

SparkBeyond General Manager, Solomon Alkhasov氏

 Microsoftは2018年から世界各国でMicrosoft AIの活用をうながす「AI Days」を開催している。国内でも同様に日本マイクロソフトのパートナー企業を対象に、アプリケーションへのAI(人工知能)実装方法を学ぶイベント「Microsoft AI Days Japan 2018 for partners」を2018年10月29日に品川本社で開催した。本稿では午後から行われたパートナーセッションの一部を紹介する。

人類の集合知でAIビジネスを加速させるSparkBeyond

 各AI ISV(独立系ソフトウェアベンダー)が20分の持ち時間で登壇し、各社のAIソリューションに関する紹介や具体的な事例を紹介した。最初に登壇したSparkBeyondの担当者は著名なキーワードである「データは新たな石油」を取り上げつつ、「この説明は見落としがある。データは原油であり、精製が必要だ」(SparkBeyond General Manager, Solomon Alkhasov氏)と語る。イスラエル発のAIスタートアップであるSparkBeyondは、データの意味を理解して複雑なパターンを発見するリサーチエンジン「SparkBeyond」を提供し、財務や製造、ヘルスケアなど各業界での採用が広まりつつある企業だ。

 とある小売業を営む企業は新規店舗出店時の利益率こそ高いものの、時が経つと他店舗の利益率を下回ったという。そこでSparkBeyondは地域の人口データなどを収集し、店舗利用者の一部に冷蔵庫や洗濯機を所有していない層を発見。データ分析を続けると好調な店舗の350メートル内にコインランドリーがあることから、洗濯機を回しながら買い物している現象を明らかにした。同社はデータセットに対して仮説的な結果を手動でテストする代わりに、測定可能なビジネス目標を念頭に最適な予測モデルを構築することで、ビジネスの「なぜ」を説き明かす支援を続けているという。

 多くの事例を持つSparkBeyondだが、20以上の業界において12カ月で10億ドルのインパクトを創出してきた。その背景にはSparkBeyondエンジンをWikipediaや地図、天気予報など数千におよぶデータソースに接続し、"人類の集合知"を構築している点が大きい。さらに各種データの入力やライブラリの情報選定、機械学習を用いてデータの変化に伴うモデルの自動適用などを通じて、予測的モデルや最適化を図る。ビジネス面ばかり強調されるが、「(SparkBeyondの)20~30%は無償提供している。非営利団体にはオープンだ」(Alkhasov氏)とCSR(企業の社会的責任)活動にも努めている。

音声認識の民主化を目指すHmcomm

 AIによる音声認識を主体としたビジネスを展開するHmcommは、「音声認識を民主化し、キーボードレスの新しい社会を自ら想像します」(Hmcomm 営業部部長 榊原満氏)をミッションに掲げているが、その切っ掛けは同社 代表取締役社長の三本幸司氏がフィリピンの商談後に発見したコールセンターだという。「巨大なビルに次々と若者が吸い込まれている様子を不思議に思った三本が尋ねたところ、24時間稼働のコールセンターだった。膨大な音声データの存在に着眼し、事業を開始した」(榊原氏)という。

 現在Hmcommは、AIを活用して音を可視化する音声AIプラットフォーム「The Voice JP」を基盤にした「Vシリーズ」を展開中。現在6ソリューションを提供しているが、その中核となるのがコンタクトセンター向けソリューションの「VContact」だ。音声認識を用いて会話をリアルタイムにテキスト化し、通話中のキーワード検出によりFAQ候補の提案や、通話終了後対応内容を自動的に要約する。とあるテレビ通販企業は顧客の個人情報を会話から抽出して帳票に自動入力。各オペレーターの対応時も登録キーワードの強調表示や、極端に会話が長引いているなどを視覚的に把握する全体管理も供える。「音声認識エンジンのチューニングも顧客に提供することで、運用コストの抑制と辞書のチューニングが可能。とある例では95%まで認識率が向上した。最終的にはオペレーターがいないコールセンターの実現を目指している」(榊原氏)。

 その他にも音声で日報を入力する「VCRM」はすでに医薬品系企業で2,000ライセンスほどの受注実績を持ち、企業の蓄積済み音声データ、音声付き画像データをテキスト化する「VBox」も、法令遵守の観点から交渉記録を通話録音が必要な金融機関などの引き合いがあるという。また、工場など雑音の多い環境でも骨伝導イヤーマイクを使用して音声認識を可能とする「VBone」、雑音を除去することで会議議事録を作成する「VMeeting」、組み込み型音声認識エンジン「VRobote」をそろえる。特にVRoboteは変なホテル 舞浜東京ベイの電子宿泊台帳システムに採用された。さらに今後は環境音が異常を検知する「FAST-D」の開発を進める。同社は「異常をデータとして持っていない。正常な環境音を一定以上収集し、機械学習でモデルを多数作成して比較する」(榊原氏)と説明。工場やインフラはもちろん、家庭内における高齢者の転倒検知など利用範囲は広い。

AI活用多言語チャットボットLOOGUE FAQを展開するARI

 クラウド技術活用を主としたソリューションサービス事業を展開するARアドバンストテクノロジ(以下、ARI)は、AI活用多言語チャットボット「LOOGUE(ローグ) FAQ」をアピールした。ARIはLOOGUE FAQについて「導入と運用メンテナンスの負荷・コストが違う」(ARアドバンストテクノロジ 中山浩平氏)と語り、「既存のFAQをそのまま使える」「辞書補正を自動で実施」「聞き返し機能で自動学習」「Microsoft Cognitive、Office 365連携」と4つの特徴を説明した。一般的なチャットボットはルールベース型を採用し、あらかじめ設定したシナリオに沿った応答を行うため、事前に類義語や言葉の揺らぎ、カテゴリーや聞き返しといった事前定義が必要となる。だが、LOOGUE FAQは質問と回答の2列を設定することで、独自辞書データを基盤に辞書強化を自動化するLLDS(Log Learning Dictionary System)で言葉の揺らぎなどを吸収。他のチャットボットと比べて運用コストを大幅に軽減できるという。

 類義語に対しては聞き返しを用いた自動学習機能を採用する。LOOGUE FAQは質問者からの問い合わせに回答できない場合、関連情報の提示もしくは聞き返しを行って追加情報を学習。例えば「中山」と質問しても当初LOOGUE FAQは回答できないものの、続いて「チャットボットについて」と質問することで、「中山」「チャットボット」のひも付けが行われる。即時反映されないものの、「回数を重ねることで『中山について』と尋ねるとチャットボットと認識して回答する」(ARI 中山氏)。その他にもMicrosoft Teams上での稼働や、問い合わせ言語に応じた自動翻訳、利用ログではAzure AD(Active Directory)のユーザーIDを含めるなどMicrosoft製品との連携機能も備える。現在は企業内のヘルプデスクをターゲットに展開しているが、今後は医療業界や小売り事業への展開を目指す。

 さらに社内のオンプレミス環境やSharePoint上のドキュメントやマニュアルをARIのファイルサーバー分析・移行ツールであるZiDOMA dataを用いてAzure BLOB上にコピーし、検索可能にする「LOOGUEビッグドキュメント」を今期開発予定。他にも 「オンプレデータのクラウド共有や、大量データファイルの自動データモデル化、チャットボットによる効率的な情報検索が可能」(ARアドバンストテクノロジ 川北和輝氏)だという。LOOGUE FAQとMicrosoft AzureのSpeech To Textによる音声サービスを某コールセンターに提供し、80%以上の高いデータ変換精度を達成した製品を来年以降に市場投入する。

GPUでデータ処理を高速化するFASTDATA.io

 GPUを使ったデータ処理用ソフトウェアエンジン「Plasma Engine」を展開するFASTDATA.ioは、「データの価値は鮮度」(FASTDATA.io ジャパンカントリーマネージャー 西田貴氏)と強調する。東京証券取引所の株式売買システム「arrowhead」のように0.5ミリ秒未満で注文応答を可能にするなど、時間短縮がデータの価値が高めるのは自明の理だ。また、とある調査によれば、2015年に生成された8ZB(ゼタバイト)の内、分析したデータは0.5%程度。その原因をFASTDATA.ioは「データセンターの供給力とCPUの処理速度は限界に達した。ビッグデータの急速な成長に追いついていない」(西田氏)と指摘する。

 そのCPUも動作周波数は頭打ちとなり、コア数の増加で対応しているが、シーケンシャル(逐次処理)コードの動作も限界が見えてきた。他方で利用シーンの多いJavaもパフォーマンスを優先した設計思想ではなく、前述したサーバーの設置場所や稼働電力がコストとなり、大量データの処理に支障を来している。これらの課題を解決するPlasma Engineは、並列処理能力を活用してビッグデータをリアルタイム処理し、NVIDIA製GPUとの組み合わせではApache Sparkの100~1000倍の高速化が可能だという。ネイティブなGPU処理で80%以上のデータ処理をGPUで実現し、Apache Spark 2.0 APIにも対応する。

 4TBにおよぶログファイルの各行に含む2つのジオ座標から間隔距離を計算して、特定の値より大きい距離値が記録された行を抽出するベンチマークでは、NVIDIA Tesla GRID K520を搭載した仮想マシン上でApache Sparkの966倍を実現。「各ワークロードは異なるため、必ずしもこの数値とならないものの、理想的環境では大幅に高速化する」(西田氏)という。現在FASTDATA.ioは日米の各企業とPoC(概念実証)を重ねており、その一例としてKDDIとの取り組みを披露した。自動運転車でリアルタイムにデータを読み取れるか検証したところ、Apache Sparkは入力ファイル数の増加に伴い処理時間が増加するものの、Plasma Engineは16ファイルの場合は34倍、128ファイル時は45倍高速に処理を終えている。FASTDATA.ioは「(Plasma Engineの)適用範囲は広い。データを高速に処理したい顧客に推奨したいソリューション」とアピールした。

ジャンルで探す