スキルアップ
2014年12月15日
ビックデータのビジネス活用に役立つ「データ分析のフレームワーク」
『ビジネス活用事例で学ぶ データサイエンス入門』より
現在、ビッグデータには大きな注目が集まっています。可能性を秘めたビックデータを実際のビジネスで役立てるには、データ分析のスキルが必要になります。ここでは、『ビジネス活用事例で学ぶ データサイエンス入門』(SBクリエイティブ)から、データを分析するときに役立つフレームワークについて紹介しましょう。
データのビジネスへの応用
近年、WebあるいはPOS(point of sale:販売時点管理)などの発達により、人の行動がデータとして簡単に蓄えられるようになりました。とくに購買にかかわるデータが多く蓄積されるようになりました。蓄積されたデータから人の購買行動に関するルールを導くことができれば、従来からビジネスの世界で行われてきたある種の経験則を超えた科学的なデータ分析のもとに、新しくビジネスを展開できるのではないかと期待されるようになってきています。
また、そこまで壮大な話ではなくとも、みなさんも日々、データを分析・活用していることと思います。たとえば、多くの人は定期的に体重計に乗ります。このとき、体重の数値そのものには大きな意味はありません。「50kgだから良い」、あるいは「51kgだから悪い」という絶対的な価値をもつ数値ではなく、あくまで体の重さの「観測データ」となります。この「観測データ」をもとに、
・各々が、自分の性別や年齢や身長などの他のデータから、理想とする健康的な体重をわりだして、目標値を設定する
・体重を長期の間で測定した時系列の「観測データ」から、暴飲暴食などの過去の行動との関連に気づき、反省する
・理想的な体型の人の適切な運動や食生活などのデータから健康管理の行動の模倣を行う
などの判断をし、具体的な行動を選択することで、体重をコントロールしようとする人は多いのではないでしょうか?
ビジネスにおいても、このように観測したデータから因果関係を推測し、未来を予測する、あるいは、望むべき結果となるように原因をコントロールしていくという作業が、さまざまなシーンで行われています。最近ではこれを行う専門職として、データサイエンティストと呼ばれる人材を組織におく企業が増えてきています。
データ分析における5つのフロー
ビジネスにおけるデータ分析の目的は、ビジネスで発生したさまざまな問題を統計解析や機械学習、データマイニングの各種方法論を駆使して解決することといえます。ここで気をつけたいのが、あくまでも問題解決が目的ということです。
たとえば、データ分析専任の会社に分析を依頼したら、やたら難しそうな大量の資料がでてきたが、結論はよく考えると当たり前のことだった、といったことはないでしょうか? 学術の分野からデータ分析者となった分析者、あるいはビジネスを熟知していない外部組織の分析に頼るとき、よくおこる事態です。
つまり、高度で複雑なモデルによる高精度な分析結果は、実は必ずしもそれだけでは価値が高いとはいえません。複雑なモデリングに時間をかけるよりも、簡単なクロス集計を用いて短時間で分析結果を出したほうが価値が高いということもビジネスの現場では珍しくはありません。解決すべき問題に合わせて、「データ分析者」が分析方法の設計・実行ができることがだいじであり、そこを誤ってしまうと、データ分析の価値は乏しくなってしまう可能性があります。
では、具体的にはビジネスにおけるデータ分析はどのように進めていくのでしょうか?
それぞれの組織構造で若干の違いはありますが、大きくは図1のフレームワークで進められています。
まず、「現状とあるべき姿」をしっかりと把握し、そのギャップとなっている要素について「問題発見」を行います。問題となる要素は複数のことが多いので、それぞれの「データの収集と加工」について検討・実施します。
そのうえで「データ分析」をします。分析は、対象を構造分解し、各要素のもつインパクトの大きさを把握、そして要素の比較を行い、ギャップの主要因となっている問題を特定します。その後、解決案を実行するにあたり、労働コストや金銭コストなどを考え、「アクション」の案を提案し、推進していきます。
つまり、データ分析とは、現状から、あるべき姿に最短ルートで近づくように、問題を抽出するということが主眼におかれ、このフレームワークで問題解決を実施していくことといえます。
【著者】酒巻 隆治(さかまき りゅうじ)
うらわ出身。株式会社ドリコム、データ分析グループ所属。得意技は、人間が環境に残す行動ログの分析。博士(環境学)。あたらしい自由を目指す通信会社で、マーケティングリサーチ、アイトラッキングなど、あたらしいマーケティング分析業務を経て、全社員英語で朝会を行う国産ECサイトの技術研究所に勤務。その後、ソーシャルゲーム、その他サービスのログ解析業を経て、DATUM STUDIO株式会社を設立。データ分析で会社を少しでもバラ色の未来にすべく、がんばっている。
【著者】里 洋平(さと ようへい)
種子島出身。株式会社ドリコム、データ分析グループ所属。得意技は、R言語によるデータ分析。Tokyo.R主催者。共著書に『データサイエンティスト養成読本』(技術評論社)、『Rパッケージガイドブック』(東京図書)がある。爆速の会社がまだ遅かった頃、その会社で推薦ロジックや株価予測モデル構築を行う。ついで遺伝子的な名前の会社で、データマイニングやマーケティング分析を行う。その後、データ分析環境の構築やデータ分析業を経て、DATUM STUDIO株式会社を設立。美しい統計理論を少しでもビジネス利用すべく、がんばっている。
うらわ出身。株式会社ドリコム、データ分析グループ所属。得意技は、人間が環境に残す行動ログの分析。博士(環境学)。あたらしい自由を目指す通信会社で、マーケティングリサーチ、アイトラッキングなど、あたらしいマーケティング分析業務を経て、全社員英語で朝会を行う国産ECサイトの技術研究所に勤務。その後、ソーシャルゲーム、その他サービスのログ解析業を経て、DATUM STUDIO株式会社を設立。データ分析で会社を少しでもバラ色の未来にすべく、がんばっている。
【著者】里 洋平(さと ようへい)
種子島出身。株式会社ドリコム、データ分析グループ所属。得意技は、R言語によるデータ分析。Tokyo.R主催者。共著書に『データサイエンティスト養成読本』(技術評論社)、『Rパッケージガイドブック』(東京図書)がある。爆速の会社がまだ遅かった頃、その会社で推薦ロジックや株価予測モデル構築を行う。ついで遺伝子的な名前の会社で、データマイニングやマーケティング分析を行う。その後、データ分析環境の構築やデータ分析業を経て、DATUM STUDIO株式会社を設立。美しい統計理論を少しでもビジネス利用すべく、がんばっている。