前二つの記事でAI・ディープラーニングのこれまでと技術の中身について見てきました。
改めて、一枚の図でまとまっているものがあるので、見てみましょう。機械学習・ディープラーニング・AI……それらの関連性がぱっと見て分かりやすいです。
今度はこれらの技術が現在のビジネスにおいてどのように活用されているのか見ていきましょう。ま、ここまでは前段のお勉強です。
目次(クリックで飛びます)
ディープラーニングビジネス(現在)
AIに出来ることは現在「認識」のみです。しかしここ数年のディープラーニングの進歩によって、誤認識率は一桁代まで下がり、様々なリアルの場での活用が模索されつつあります。
現在、機械学習を利用したプロジェクトで一番多いものはIoTみたいです。そして科学技術系、製造、テレコミュニケーションと続きますので、これらの分野には特に注目ですね。
そして以下に見るように、APIによる利用が主ですね。SoE拡大によって様々なビジネスチャンスが広がっています。
APIについてはこちらのサイト様が大変詳しくまとめてくださっております。
画像・映像からキーワード抽出
既に散々見てきた画像認識。IBM WatsonやGoogle Cloud、Microsoftなど、各社が画像・映像からキーワードを抽出するサービスを展開しています。
- IBM Watson AlchemyVision:画像分類
- GOOGLE CLOUD VISION API:画像のカテゴリ分類
- Microsoft Computer Vision:画像分類、テキスト認識
- docomo 画像認識:画像分類
- clarifai:画像タグ付け
- imagga:画像タグ付け…………etc(多すぎて拾いきれませんね)
もちろんスタートアップ企業も参入しており、Clarifaiという企業はクレカ登録必要ですが、無料APIが利用出来るみたいです。ここは画像をディープラーニングによって解析し、キーワードをタグ付けするのですが、これは例えば放送業界に属する会社がおすすめコンテンツ(レコメンド)を提供する際の元データとして活用出来るわけです。
※通常、放送コンテンツはテキストデータ化されていないため、そのままだとレコメンドが出来ません(分類して似たものをタグ付けする手段がない)。
また、Emotientは人の表情から感情を読み取ります。例えば医療サービスに活用することで、前記事で書いたような「予兆」の気づきを得られるようになります。セキュリティとしての顔認証も精度が上がっていきそうですね。
- Microsoft Emotion:表情分類
- Microsoft Face:表情分類
- Emotient(Apple):感情読み取り
- APICloud.Me FaceMark:顔認証…………etc
音声からもキーワード抽出
音声(聴力)も人の認識において重要な役割を担っています。画像が認識出来るのですから、当然音声だって認識可能なはずです。
- IBM Watson Speech to Text:音声文字変換
- GOOGLE CLOUD SPEECH API:音声文字変換
- Microsoft Custom Recognition Intelligent Service (CRIS):音声認識
- docomo 音声合成:音声読み上げ…………etc(まだなかったかもw)
例えばコールセンターの無人化に活躍が期待されており、音声に含まれる波長をリアルタイムで解析して、電話主の感情を理解し、それを踏まえた対応を取っていくという賢い機械によるオペレーションが可能になります。
自然言語の理解
ここでぱっと思いつくのはGoogleの翻訳ですが、まだまだ完成途上なので別のものを。
- IBM Watson AlchemyLanguage:自然言語理解
- docomo 言語解析:言語解析(もちろん日本語対応。そういえばWatsonって日本語も出来るんでしょうか? 学習の仕組みは同じですが……)
- Repl-AI:対話AI作成
- Google Translate:翻訳
- Microsoft Linguistic Analysis:テキスト解析…………etc
AlchemyAPIやLexalyticsは、自然言語で書かれた一定量の文章からサマリやテーマの抽出が出来るサービスを提供しています。ニュース記事も機械で書けてしまう時代ですよね。また、Twitter等のSNSクローラとして、企業の消費者動向調査でも活用されています。
さらに自然言語と画像がリンクされれば、ほとんど人間と同じように認識することが可能になります。
不正検知
様々な不正検知がありますが、一番導入が簡単なのはインターネット売買における不正検知でしょうか。
なにか不正がされる直前、特徴的な動きをしていたということが多くあり、これをデータとして集めて照合することで、怪しい売買をマークすることが可能になります。
ベイズ推定を応用した迷惑メールフィルターやネットワークへの不正アクセス検知もどんどん精度を上げていくでしょう。
店舗経営改善
これまでのビッグデータではWebの動線解析は広まってきていましたが、今後は店舗における動線解析も広がりそうです。
従来からある監視カメラ、あるいはIoTと組み合わせて人の動きを認識して可視化できれば、より効果の高い配置等も機械が探しだしてくれるはずです。
調べてみると、ABEJAという会社がビデオに写る人の年齢や性別を認識し、顧客データとして記録出来るようにしたサービスを提供しています。
予測ビジネス
膨大なデータを集めて関連性を分析し、例えば設備故障を事前に予測することも可能です。先ほどの医療の予兆解析なんかも、今後広がるであろう予防サービスの主力になりそうですよね。
見ていて面白そうだったのはGastrograph。製造工程を監視して細かな違いを発見し、ビールの味を判断出来るのだとか。
また、StockNeural.netは株価の予測モデルを作っているらしいですよ(肝心のブラックスワンだけ分からないモデルにしかならないと思いますけど、どうなんでしょう)。それが可能なら人々の流行も予測できるような日が来るかもしれません。
予測ビジネス系はこちらにたくさん事例が載っています。
コンテンツ産業においても……
私が気にしているのは「創作分野」において、AIがどれだけ脅威になるかというところ。調べてみたらこんな記事がありました。
ディープラーニングで既存の映像をありとあらゆる絵画テイストに自動で変換できる驚異のアルゴリズム
あるアニメーション映像をゴッホやピカソといった著名画家テイストに描き換えてしまうという技術。まあ細かいところを見たら違いはあれど、素人からしたら分かりませんよね。だってポイントになりそうな8割くらいの特徴抽出してるんだもの。
前にも引用しましたが、小説だって作れちゃうという^^;
国がやるような大掛かりな事業も
現在どこまで動いているか分かりませんが、人の動線を把握出来るということは、例えば交通渋滞を予測できるということで、渋滞緩和のための街構想にもディープラーニングが関わってくることになるのでは? と思っています(オリンピックで東京を作り変えている最中ですし)。
派生ビジネス的な
ハードウェアビジネス
非ノイマン型コンピュータに飛躍し、次世代ハードウェア・次世代アーキテクチャも模索されています。
現時点ではGPUが共通プラットフォームとして成長しているようですが、非常に高額で普及の足かせになっています。利用にはクラウドによる方法が考えられますが、いずれにせよ、より高度化された処理技術(チップ)を製造出来た企業は他社に圧倒的な優位性を持つことになります。
データサイエンティストの需要増
前も書きましたっけ、これだけ各社データ解析が差別化に繋がる時代で、データ解析の専門家(データサイエンティスト)は圧倒的に不足しています。いいビジネスチャンスじゃないでしょうか。
書いてから思ったんですが、先にIBMとかGoogleとかの取り組み事例を出すべきだったなと。まだ続きます。
→もうちょっと詳しく未来図を書きました。
他のIT系テーマについて以下でまとめております。よろしければ合わせてお読みいただけるとうれしいです。