ビッグデータには検索ワードなども含まれる
対象になってるデータの大きさが大きくて、それゆえに「ビッグデータ」って呼ばれるわけですね。
なるほど。
あのこれまでもいろいろな研究者の方が、データを集めてこられたと思うんですけど、そのデータとビッグデータはどう違うんですかね。
今まで研究者とか政府が集めてきた統計調査は、調査をすることが目的で集められてきたデータだったんです。
ですけれども今「ビッグデータ」って呼ばれてるものは、主にですね購買の履歴ですとか、あるいはICカードの交通機関の利用の記録ですとか、まあ他の業務をやるためについでに集められたデータっていう、そういう側面があるんですよね。
なるほど。
ですからついでに集めてるものですから、基本的にコストがかからないわけですね。
それともうひとつの特徴は、最初から記録が電子的な記録なんですね。
ですから「今何が起こってるか?」ということを、瞬時に捉えることができるというそういう特徴もあるんですね。
調査をして集めて集計するっていうところに、時間がかからないんですね。
はいはい。
ですからタイムラグが無いっていう形になりますよね。
すぐに…集計した結果がすぐにわかるって事ですね。
そうですね。
ビッグデータにはSNSや検索ワードなどの言葉のデータも含まれます。
日々の何気ないつぶやきから生まれたこのウェブサイト。
「インフルエンザ」というキーワードを集めています。
前後の単語や文脈から発信者本人が、インフルエンザ患者かどうかを判定。
そのデータをリアルタイムで集計・分析し、全国の患者数と都道府県別の分布を割り出しています。
実はサッカーの試合にも、リアルタイムでデータを集めるシステムが使われています。
「トラッキングシステム」
スタジアムに設置された16台の特殊なカメラで、ピッチにいる全ての選手とボールの動きを自動で記録します。
自動的にカメラが「この選手はここにいる」とか、「この時間でスプリントを何回しました」とかっていう情報も、アニメーションとか走行距離何kmとかという情報も、リアルタイムで取ることができるようになっています。
たまに誰がどれくらい走ったか出てますがそういうシステムで、計測してるんですね。
専用のカメラを付けて、もう自動的に判別してると。
へぇ~!その記録はただちにアニメーションで再現できます。
例えばハーフタイムに全選手のプレーを振り返りながら、後半の作戦を立てることもできるんです。
しかしビッグデータにも落とし穴が…。
統計学で部分的な情報を集めて、全体を推計するというお話でしたけど、ビッグデータだと低コストでできるわけですよね。
「統計学」カテゴリーの関連記事