データベースのグローバル化とローカル化

実態はよく分かっていないけど、みんなが何となく使っているカタカナ言葉は色々あると思います。

最近色々な場所で聞かれる言葉として、「ビックデータ」や「AI(人工知能)」があります。
どちらも最近になって出来た内容ではありません。昔からある内容です。

実際に、私も10年ほど前、150億円の税金を投入された経済産業省の国プロジェクトのコンサルティングを実施した際、日本発(笑)のビックデータ技術の活用やある特定領域データの機械学習によるAI応用について、国内外の提携先やアプリケーションの在り方などを検討したことがあります。

プロジェクト自体は、国家プロジェクトならではの船頭不在によって、惨憺たる結果になってしまいましたが、それぞれの民間企業や研究機関の実データを用いた検討自体は非常に興味深いものでした。

当時、データの議論になると、必ず、人は2種類のどちらかに分かれるんだなと感じました。

(1)データベースの持ち方・作り方・取り方自体に興味がある人
(2)データベースをどう解釈するかに興味がある人

私は、(2)のどう解釈するかに興味がある人です。
当然、(1)と(2)の内容は切っても切れない関係なのですが、人の趣向としてはどちらかに偏るものだなと思っています。

そして、最近自分自身が感じていることとして、データ自体も今後、2種類のタイプに大きく分かれていくのではないかという事です。

(A)グローバル化したデータベース(≒ビックデータ)
(B)ローカル化したデータベース

(1)のデータベース自体に興味がある人は、(A)のグローバル化したデータベースが好きな気がします。

とにかく、様々なデータ(例えば、SNSデータ、Web上の動画や音声データ、ECでの購入データ、車載センサーやGPSなどのセンサーデータ、コンビニの販売履歴などのPOSデータや取引詳細データ、Webサービスのログデータ、会社のファイルデータや作成履歴、ポイントカードなどCRMシステムで得たデータなどなど)を集めれば、人の行動パターンが読めると考える人です。

私は(2)のタイプなので、大した意味を持たない属性のデータをいっぱい集めた所で何も意味はないと思いますが、データベース自体は大規模にどこかに格納され、そのデータとデータ自体の連関式が時系列で変化していく様子が見える化されるのであれば、それは非常に面白いと思います。

恐らく、それ自体はGoogleがずっと目指している世界だと思います。

ただ、そうしたビックデータを集める際に大変なのが、データとの接点です。人の全ての接点が自動的に大規模格納庫にデータとして流れていくのであれば、そのデータベースはとんでもない意味を持つと思いますが、なかなかそうはいきません。(例えば、今日自分がどの靴をどちらの足から履いて玄関を出発したかすら、Googleにはデータが届けられません。)

また倫理的な問題もあります。医療データや個人情報に関するデータは現状コンプライアンス的に勝手に収集・利用できないように調整されています。(国家間の事情もあると思いますが。)

そうなると、実用ベースで意味のあるデータを集めた(B)の「ローカル化したデータベース」が重要になってくると思います。

例えば、会社の社内データなどをその会社(経営者)にとって意味がある形で自動的に見える化するだったり、個人の健康データを自分なりのパラメータでデータを集めて既存アプリで見えるようにする等のニーズは今後高まると思います。

最終的に得たいもの(目的)をベースに、必要となる重要なデータを取りに行き、解釈する数式を入れる、もしくは解釈を機械学習させるプロダクトをFRINGEでは今後作っていきたいと思っています。

関連記事

  1. 資料作成のコツ

  2. そしてホテルの支配人へ

  3. アクセレータープログラム(1週目)

  4. 事業承継

  5. 地味につづける

  6. 取材

  7. ゴール設定と習慣化

  8. アクセレータープログラム(最終週)

最近のBLOG

  1. 2024.05.21

    SusHi Tech Tokyo
  2. 2024.03.19

    TRY ANGLE EHIME
  3. 2024.01.2

    仕事始め
PAGE TOP