総務省トップ > 政策 > 白書 > 26年版 > フレームワーク
第1部 特集 ICTがもたらす世界規模でのパラダイムシフト
第1節 様々な価値を生み出すビッグデータ

(1) フレームワーク

ア 対象主体

いわゆる「ビッグデータ」には、個人、企業、政府等あらゆる経済主体が多様な手段・ルートで生成したデータが含まれている。構造化データのみならず非構造化データが大量に生成され、それらの活用により新たな社会・経済的価値が創出されているものと考えられる。本来であれば、ビッグデータとして想定されるデータ全てについて、その量を把握できることが望ましいが、特に個人に関わるものなど、その把握が困難と考えられるものも存在する。今回の調査では、計測の対象とする主体及び対象データについて、昨年の調査より対象を拡張した上で流通量の測定を実施する。

まず、対象主体の選定にあたっては、ビッグデータを活用することにより、社会・経済的価値を創出する主要な経済主体は企業であると考えられることから、昨年の調査と同様、企業が電子的に受信するデータについて計測を行った。なお、ここで言う「企業が電子的に受信するデータ」には、同一企業内で受信するデータ、他の企業、個人又は政府から受信するデータの全てを含むものとする。

また、推計対象産業は、産業連関表にある13部門分類のうち、農林水産業、鉱業、公務及び分類不明を除く9部門を対象産業に選定の上、推計に必要なデータの収集を行った7、8図表3-1-2-1)。

図表3-1-2-1 データ流通量計測の対象主体
(出典)総務省「ビッグデータ時代における情報量の計測に係る調査研究」(平成26年)
イ 計量対象データ

続いて、企業が受信したデータ流通量を推計するにあたっての計量対象データについて説明する。いわゆるビッグデータはさまざまな特性を有する複数のデータから構成されていること、またビッグデータを構成するデータ群は時間とともに動態的に変化していくことを鑑みれば、ビッグデータの構成データを画一的に画定し、その中のすべてのデータを対象にしたデータ流通量を推計することは現実的には困難である。そのため、実際に流通量を推計するにあたっては、計量対象とするデータを限定する必要がある。

そこで、今回のデータ流通量推計では、推計に必要なデータの取得可能性や、企業のマーケティング戦略や意思決定等の企業レベルでの経済活動におけるデータの利活用状況を考慮しつつ、構造化データとして8種データ(顧客データベース、経理データ、POSデータ、レセプトデータ、eコマースの販売ログデータ、GPSデータ、RFIDデータ、気象データ)、非構造化データとして9種データ(業務日誌データ、CTI音声ログデータ、固定IP電話の音声データ、携帯電話の音声データ、電子メール、ブログ・SNS等の記事データ、アクセスログデータ、電子カルテデータ、画像診断データ)の計17種のデータについては、昨年に引き続き計量対象データに設定した。

これに加えて、今回の調査では非構造化データから4種(監視・防犯カメラデータ、センサーログデータ、交通・渋滞情報データ、動画・映像閲覧ログ)を新たに追加した(図表3-1-2-2)。これらのデータを追加した理由は、最近のICTの進化に伴い、データ量が急増していると考えられるデータであり、かつ、企業へのアンケートにより捕捉可能であると判断したためである。

図表3-1-2-2 ビッグデータの構成データと流通量の計量対象データ
(出典)総務省「ビッグデータ時代における情報量の計測に係る調査研究」(平成26年)


7 全国の企業モニター41,135名を対象にウェブアンケートを実施。うち、5,003名から回答があった(回収率12.2%)。対象企業は、産業区分では(1)農林水産業、(2)鉱業、(3)製造業、(4)建設業、(5)電力・ガス・水道業、(6)商業、(7)金融・保険業、(8)不動産業、(9)運輸業、(10)情報通信業、(11)サービス業(医療分野以外)及び(12)医療分野の12区分。ウェブアンケート会社が保有するモニターから、対象産業に就業中のモニターを抽出。具体的には「ICTサービスおよびメディアの利用状況・利用頻度」、「ICTサービスおよびメディアの単位あたりデータ量」、「サーバの利用状況」を主な調査項目として設計した。付注3-1も参照されたい。

8 公務及び分類不明については、「企業が電子的に受信するデータ」に該当しないため、当初より対象から除外した。また、農林水産業及び鉱業は調査対象に含めていたが、アンケートの結果、分析に必要なサンプルが集まらず、調査対象から除外した。

テキスト形式のファイルはこちら

ページトップへ戻る