(2)企業等におけるビッグデータの活用状況 ここでは、企業等がどのような領域において、どのようなデータを活用し、どのような分析によって、どのような効果を得ているかについて、アンケート調査を元に分析を行う 15 。 ア データの活用目的 まず、どのような目的でデータを活用しているのかについて尋ねた。アンケート調査では、データの活用目的を以下の8種類に分類した(図表5-4-3-6)。 全体として、「経営管理」(47.6%)が最も多く、「業務の効率化」(46.9%)、「商品・サービスの品質向上」(42.9%)、「顧客や市場の調査・分析」(40.5%)までが40%を超える結果となった。 産業別にみると、「商業」や「不動産業」では「商品・サービスの品質向上」、「業務の効率化」など複数の目的が50%を超えており、他の産業に比べて比較的データの活用が進んでいると推察される(図表5-4-3-7)。 イ データを活用している領域 次に、どのような領域においてデータの活用を行っているのかについて尋ねた。アンケート調査では、データ活用領域を「経営全般」、「企画、開発、マーケティング」、「生産、製造」、「物流、在庫管理」、「保守、メンテナンス」の5つに設定しそれぞれについて集計した。その結果、全体の傾向として「経営全般」、「企画、開発、マーケティング」でのデータ活用の割合が高くなっており、特に「経営全般」領域においては、全体の約57%がデータを活用している。また、上記5つの領域のいずれかにおいて、データを活用している割合は約79%と8割近くがいずれかの領域においてデータを活用していることが観察された。 産業別にみると、「商業」、「金融・保険業」、「不動産業」では、「経営全般」での活用割合が6割以上と他の産業に比べてやや高く、「企画、開発、マーケティング」における活用割合では、上記3産業に加えて、「情報通信業」が5割程度と他産業に比べやや高い状況となった。また、「電力・ガス・水道業」、「情報通信業」では、「保守、メンテナンス」の領域においてデータを活用している割合が他産業に比べてやや高く、自社が提供・敷設するインフラのモニタリング状況をデータとして把握し、それを故障の予兆把握や需給の管理・予測等に活用しているものと推察される。また、製造業における「生産、製造」、運輸業における「物流、在庫管理」は本業に関連する領域であり、データ活用の割合が高くなった(図表5-4-3-8)。 ウ データの種類 続いて、どのような種類のデータを分析に活用しているかについて尋ねた。その結果、今回対象とした21メディアのうち、「顧客データ」、「経理データ」、「業務日誌データ」、「電子メール」などの従来から社内に蓄積されているデータが多く分析に活用されている。一方で、「RFIDデータ」、「センサーデータ」といったICタグやセンサーから収集されるデータと「交通量・渋滞情報データ」、「GPSデータ」といった位置情報に関連するデータなどは相対的にまだ広く分析に活用されるというような状況にないことがうかがえる(図表5-4-3-9)。 エ データの組合せ 続いて、データを分析する際に、複数のデータを組み合わせて分析を行っているかどうかを尋ねた。その結果、2種類以上のデータを組み合わせて分析を行っているという割合は全体で3割弱となった。多くの企業等では別々のデータを組み合わせて分析するのではなく、1種類のデータを単独で分析している状況にあることがうかがえる。 産業別にみると、多くの産業ではデータを組み合わせた分析は2種類程度までとなっているが、電力・ガス・水道業や金融・保険業などでは3種類以上のデータを組み合わせて分析している割合がやや高くなった 16 (図表5-4-3-10)。 分析する際のデータの組合せをメディア別にみると、「交通量・渋滞情報データ」、「気象データ」が平均して2種類以上を組み合わせて分析しているという結果になった。つまり、これらのデータを用いて分析する企業等は他にもう1種類以上のデータを組み合わせて分析しているということになる。分析に活用されている割合が高い「顧客データ」、「経理データ」、「業務日誌データ」、「電子メール」はいずれも2種類以上のデータを組み合わせて分析されている割合が低く、活用はされているものの他のデータとの組み合わせた分析は行われていないことがうかがえる(図表5-4-3-11)。 オ 分析頻度 続いて、データを活用して分析を行う頻度について尋ねた。その結果、全体として高頻度で分析を行う企業等からあまり頻繁に分析を行わない企業等まで万遍なく存在しているといえる。ただし、産業別にみると、「金融・保険業」や「運輸業」では「1日未満」の割合が他産業に比べて高い傾向にあり、先進的な企業等では日常的に分析を行っていることがうかがえる(図表5-4-3-12)。 カ 分析手法 続いて、どのような手法で分析を行っているのかについて尋ねた。「Excel、Access等の基本ソフト」、「データ分析ソフト、統計ソフト」、「Hadoop、Storm等の分散処理基盤」を活用した分析の実施有無について確認したところ、全体の5割強がこれらいずれかを活用した分析を行っている結果となった。その多くが「Excel、Access等の基本ソフト」(50.8%)であり、「Hadoop、Storm等の分散処理基盤」については全体の1.1%であった。 産業別にみると、いずれかを活用した分析を行っている割合が「電力・ガス・水道業」で最も高く75.0%となった。「Excel、Access等の基本ソフト」、「データ分析ソフト、統計ソフト」についても「電力・ガス・水道業」が最も高く、「Hadoop、Storm等の分散処理基盤」については「商業」が最も高い割合となったが、産業によって大きな差はみられなかった(図表5-4-3-13)。 キ 分析人材 続いて、どのような人材が分析を行っているかについて尋ねた。「業務に応じた各担当者」、「専門のデータ分析担当者」、「外部に委託している」の割合を確認したところ、全体の9割弱で「業務に応じた各担当者」が分析を行っているという結果となった。「専門のデータ分析担当者」(17.8%)は「外部に委託している」(4.3%)に比べて高い割合となり、データ分析については、比較的企業内部で行っている実態がうかがえる。 産業別にみると、「電力・ガス・水道業」で「専門のデータ分析担当者」が分析を行っているという割合がやや高く29.3%となった。また、「金融・保険業」では「外部に委託している」という割合が15.7%とやや高く、「専門のデータ分析担当者」(16.2%)と同程度となっている。「金融・保険業」では「Excel、Access等の基本ソフト」では困難な分析が多く(全産業中最低の45.8%)、ある程度外部の人材を活用する傾向が推察される(図表5-4-3-14)。 ク 分析結果の活用方法 続いて、分析結果の活用方法を、「見える化」、「予測」、「自動化」の3類型に分類して尋ねた(図表5-4-3-15)。 図表5-4-3-15 データの活用方法と活用例(出典)総務省「ビッグデータの流通量の推計及びビッグデータの活用実態に関する調査研究」(平成27年) 全体の傾向として「見える化」(59.2%)、「予測」(40.8%)、「自動化」(6.9%)の順に割合が高くなっている。このことからまず「見える化」によって現状を把握することから始め、把握できたものに対しては今後の動向等を「予測」し、最終的には一連の動作を「自動化」するといった大きな流れがあるのではないかと推察される。 産業別にみると、「見える化」による活用割合は、「金融・保険業」(70.6%)で、「予測」による活用割合は、「電力・ガス・水道業」(48.1%)で、「自動化」に活用している割合は「金融・保険業」(9.9%)で最も高くなっている(図表5-4-3-16)。 ケ ビッグデータ活用と効果の関係 (ア)データ活用の効果有無 データを活用し、効果があったかどうかを5つの領域それぞれで尋ねた。「経営全般」では全体のおよそ3割、「企画、開発、マーケティング」ではおよそ2割、「生産、製造」、「物流、在庫管理」、「保守、メンテナンス」ではおよそ1割がデータを活用し、効果を得ているという結果となった。産業によっては、ほぼ無縁の領域であることや、まだそれほどデータ利活用が進んでいないことも推察される「生産、製造」、「物流、在庫管理」、「保守、メンテナンス」では低い結果となった。 産業別にみると、「不動産業」(40.2%)、「商業」(34.1%)、「サービス業」(32.7%)の3割以上が「経営全般」で効果を得ており、やや高い結果となった。「企画、開発、マーケティング」では「不動産業」(27.1%)、「商業」(24.8%)がやや高いものの他の産業でも大きな差はない。全体では1割程度の効果であるものの、「生産、製造」においては「製造業」(28.1%)、「物流、在庫管理」においては「運輸業」(30.8%)、「商業」(24.1%)、「保守、メンテナンス」においては「電力・ガス・水道業」(21.3%)の2割強が効果を得ている(図表5-4-3-17)。 各領域でデータを活用している割合とデータを活用して効果を得ている割合から効果の達成率を計算すると「物流、在庫管理」で最も高い達成率(67%)となっている。逆に、「経営全般」ではデータ活用割合が最も高いものの、達成率では最も低い結果となった。このことから「物流、在庫管理」ではデータ利活用の効果を得られやすい領域と考えられる(図表5-4-3-18)。 (イ)データ利活用の効果を得られた企業等と得られなかった企業等の比較 データ利活用の効果を得られた企業等と得られなかった企業等では、分析手法や分析に活用するデータに何らかの違いがあることが考えられる。そこでどの産業でも活用割合が比較的高かった「企画、開発、マーケティング」領域においてデータを活用している企業等を対象に効果を得られた企業等と得られなかった企業等の比較を行った 17 。 A 分析手法、分析人材、分析結果の活用における比較 まず、分析手法をみると「Excel、Access等の基本ソフト」では効果を得られた企業等と得られなかった企業等の間でそれほど差がみられなかったものの「データ分析ソフト、統計ソフト」では大きな差がみられた。同様に分析人材においても「業務に応じた各担当者」ではそれほど差がみられなかったものの「専門のデータ分析担当者」では比較的差が見られた。このことから企業等が「業務に応じた各担当者」が「Excel、Access等の基本ソフト」を活用してデータ分析を行う段階から「専門のデータ分析担当者」が「データ分析ソフト、統計ソフト」を活用する段階に分析が高度化するとデータ活用の効果を得られ易くなると推察される。また、分析結果の活用では「見える化」、「予測」、「自動化」のいずれでも比較的差がみられた(図表5-4-3-19)。 B 分析頻度における比較 次に、分析の頻度で比較を行った。効果を得られた企業等の過半数が1か月未満の頻度で分析を行っているのに対して、効果を得られなかった企業等の過半数が1か月以上の頻度で分析を行っていることがわかった(図表5-4-3-20)。このことから、データ活用の効果を得るためにはある程度短い間隔でデータ分析を行うことが必要ではないかと考えられる。 C 分析に活用するデータの種類における比較 次に、分析に活用するデータの種類で比較を行った。効果を得られた企業等は、5種類以上のデータを分析に活用しているという割合が最も高いのに対して、効果を得られなかった企業等の過半数が2種類以下となっている(図表5-4-3-21)。 D 分析する際のデータの組合せにおける比較 最後に、分析する際のデータの組合せで比較を行った。1種類(単独)で分析を行うという回答が効果の有無に係らず最も高くなっているものの、データを組み合わせた分析(2種類以上)は効果を得られた企業等の方が高い結果となった(図表5-4-3-22)。 (ウ)分析手法、分析人材の重要性 データ活用の効果を得られた企業等はデータ分析の手法や人材、活用するデータにおいて効果を得られなかった企業等よりも進展していることが確認できた。ここでは、分析手法と分析人材の進展が効果達成にどれだけ差を生み出しているのかを検証した。まず分析手法「Excel、Access等の基本ソフト」のみ、かつ、分析人材「業務に応じた各担当者」のみのグループと分析手法「データ分析ソフト、統計ソフト」以上 18 、かつ、分析人材「専門のデータ分析担当者」以上 19 のグループを作成した。この2グループにおいて各領域で効果を得られた割合を比較した。その結果、分析の手法、人材が進展しているグループの方がいずれの領域でも高い割合でデータを活用し、効果が得られていることがわかった(図表5-4-3-23)。 (エ)計量分析 ここまでみてきたように、効果を得られた企業等と得られなかった企業等でグループ分けをした上で、効果を得られた割合を比較すると効果を得るためには、専門のデータ分析人材が多種データを組み合わせた上で高度な分析手法を駆使し、短い間隔で分析を行うことが、それぞれ重要であることが確認できた。これらのことを計量分析(ロジットモデル分析)によって検証した 20 。 その結果、分析手法では「データ分析ソフト、統計ソフト」の活用、また「1か月未満の分析頻度」、「分析に活用するデータの種類」、「分析する際のデータの組合せ」が効果を得るために有意であることが確認できた(図表5-4-3-24)。 この結果から「Excel、Access等の基本ソフト」を活用して分析を行うという段階から一歩進んだデータ分析に取り組むことが効果を達成するためには必要であることが確かめられた。また、ビッグデータ時代においては多種多様なデータが高頻度で発生・蓄積されるようになり、それらを有効に活用すべく多様なデータを組み合わせて短い間隔で分析することが求められていると言えるだろう。今回は、「専門のデータ分析担当者」が有意とならなかったが、これは、日本ではまだデータサイエンティストといったデータ分析の専門人材が少ないためと考えられ、今後専門人材が増え、活躍することによって、有意性が表れてくる可能性がある。 15 アンケートの実施条件については巻末の付注7-1を参照。 16 電力・ガス・水道業については、分析に活用しているデータの種類が平均1.7種類なのに対して、分析する際のデータの組合せが平均2.2種類となっており、今回調査対象とした21メディア以外のデータを活用していることが推察される。 17 他の領域についても検証を行ったが「企画、開発、マーケティング」領域とほぼ同じ結果であった。 18 分析手法において「データ分析ソフト、統計ソフト」、「Hadoop、Storm等の分散処理基盤」のいずれかを回答 19 分析人材において「専門のデータ分析担当者」、「外部に委託している」のいずれかを回答 20 分析の詳細については巻末付注7-2を参照。 21 「アイトラッキング・データ」はトビー・テクノロジー・ジャパン(http://www.tobii.com/ja-JP/eye-tracking-research/japan/)の技術を採用した。 22 被験者に対し、アイトラッキングにより収集したデータを確認し、「何故ここを見たのか」などのフォローテストも実施しており、視線に意味合いを持たせている。