Beth Yn union yw 'Data Mawr'?

A Pam Mae'n Braf Mawr?

'Data mawr' yw'r wyddoniaeth newydd o ddeall a rhagfynegi ymddygiad dynol trwy astudio cyfrolau mawr o ddata anstructuredig. Gelwir data mawr hefyd yn 'ddadansoddiadau rhagfynegol'.

Mae dadansoddi swyddi Twitter, porthiannau Facebook, chwiliadau eBay, tracwyr GPS a pheiriannau ATM yn rhai enghreifftiau o ddata mawr. Mae astudio fideos diogelwch, data traffig, patrymau tywydd, teithiau hedfan, logiau twr ffôn cell, a thracwyr cyfradd y galon yn ffurfiau eraill. Mae data mawr yn wyddoniaeth newydd aflonydd sy'n newid yn wythnosol, a dim ond ychydig o arbenigwyr sy'n ei ddeall i gyd.

Beth yw rhai enghreifftiau o ddata mawr mewn bywyd rheolaidd?

screenshot http://project.wnyc.org/transit-time

Er bod y prosiectau data mwyaf mawr yn aneglur iawn, ceir enghreifftiau llwyddiannus o ddata mawr sy'n effeithio ar fywyd pob dydd unigolion, cwmnïau a llywodraethau:

Arfau rhagfynegi firws: trwy astudio data cymdeithasol-wleidyddol, data tywydd a hinsawdd, a data ysbyty / clinigol, mae'r gwyddonwyr hyn bellach yn rhagfynegi achosion twymyn dengue gyda rhybudd ymlaen llaw o 4 wythnos.

Gwylio Lladdiad: mae'r prosiect data mawr hwn yn proffiliau dioddefwyr llofruddiaeth, rhai dan amheuaeth, a throseddwyr yn Washington, DC. Mae'r ddwy ffordd fel anrhydedd i'r ymadawedig ac fel adnodd ymwybyddiaeth i bobl, mae'r prosiect data mawr hwn yn ddiddorol.

Cynllunio Teithio Trawsnewid, NYC: cyfunodd rhaglennydd radio WNYC Steve Melendez yr atodlen isffordd ar-lein gyda meddalwedd teithio teithio. Mae ei greu yn gadael i New Yorkers glicio ar eu lleoliad ar y map, a bydd rhagfynegiad o amser teithio ar gyfer trenau ac isffordd yn ymddangos.

Mae Xerox wedi lleihau eu colled gweithlu: mae gwaith y ganolfan alwadau'n warthus yn emosiynol. Mae Xerox wedi astudio cyfres o ddata gyda chymorth dadansoddwyr proffesiynol, ac yn awr gallant ragweld pa llogi canolfannau galw sy'n debygol o aros gyda'r cwmni hiraf.

Cefnogi gwrthderfysgaeth: trwy astudio cyfryngau cymdeithasol, cofnodion ariannol, amheuon hedfan, a data diogelwch, gall gorfodi'r gyfraith ragweld a lleoli amheuon terfysgol cyn iddynt wneud eu gweithredoedd drygionus.

Addasu marchnata brand yn seiliedig ar adolygiadau cyfryngau cymdeithasol : mae pobl yn rhyfedd ac yn rhannu eu meddyliau ar-lein ar dafarn, bwyty neu glwb ffitrwydd yn gyflym. Mae'n bosib astudio'r miliynau o swyddi cyfryngau cymdeithasol hyn a rhoi adborth i'r cwmni ar yr hyn y mae pobl yn ei feddwl am eu gwasanaethau.

Pwy sy'n Defnyddio Data Mawr? Beth ydyn nhw'n ei wneud gyda hi?

Mae llawer o gorfforaethau monolithig yn defnyddio data mawr i addasu eu cynigion a'u prisiau i wneud y gorau o foddhad cwsmeriaid.

Pam Ydy'r Data Mawr o'r fath Fargen Fawr?

Mae 4 peth yn gwneud data mawr yn sylweddol:

1. Mae'r data yn enfawr. Ni fydd yn ffitio ar un gyriant caled , llawer llai o ffon USB . Mae nifer y data yn llawer mwy na'r hyn y gall meddwl dynol ei weld (meddyliwch am biliwn biliwn o biliwn megabytes, ac yna lluoswch hynny â mwy o filiynau).

2. Mae'r data yn aflonydd ac yn anstrwythuredig. Mae 50% i 80% o waith data mawr yn trosi a glanhau'r wybodaeth fel bod modd ei chwilio a'i datrys. Dim ond ychydig o filoedd o arbenigwyr ar ein planed yn gwybod yn llawn sut i wneud y data hwn yn glanhau. Mae'r arbenigwyr hyn hefyd angen offer arbenigol iawn, fel HPE a Hadoop, i wneud eu crefft. Efallai ymhen 10 mlynedd, bydd arbenigwyr data mawr yn dod yn dwsin o dimen, ond ar hyn o bryd, maent yn rhywbeth prin iawn o ddadansoddwr ac mae eu gwaith yn dal yn aneglur iawn ac yn ddiflas.

3. Mae data wedi dod yn nwydd ** y gellir ei werthu a'i brynu. Mae marchnadoedd data yn bodoli lle gall cwmnïau ac unigolion brynu terabytes o gyfryngau cymdeithasol a data arall. Mae'r rhan fwyaf o'r data yn seiliedig ar gymylau, gan ei fod yn rhy fawr i ffitio ar unrhyw un disg galed. Mae prynu data yn gyffredin yn cynnwys ffi tanysgrifio lle rydych chi'n ymuno â fferm gweinydd cwmwl.

** Arweinwyr offer a syniadau data mawr yw Amazon, Google, Facebook, a Yahoo. Oherwydd bod y cwmnïau hyn yn gwasanaethu cymaint o filiynau o bobl gyda'u gwasanaethau ar-lein, mae'n gwneud synnwyr mai'r man casglu a'r gweledigaeth y tu ôl i ddadansoddiadau data mawr fydden nhw.

4. Mae posibiliadau data mawr yn ddiddiwedd. Efallai y bydd meddygon yn rhagweld un diwrnod o drawiadau ar y galon a strôc ar gyfer unigolion wythnosau cyn iddynt ddigwydd. Gallai gwrthdrawiadau awyrennau a automobile gael eu lleihau gan ddadansoddiadau rhagfynegol o'u data mecanyddol a phatrymau traffig a thywydd. Gellid gwella'r dyddio ar-lein trwy gael rhagfynegwyr data mawr ar bwy sy'n bersonau cydnaws i chi. Efallai y bydd cerddorion yn cael cipolwg ar ba gyfansoddiad cerddoriaeth yw'r mwyaf pleserus i chwaeth newidiol cynulleidfaoedd targed. Efallai y bydd maethegwyr yn gallu rhagfynegi pa gyfuniad o fwydydd sy'n cael eu prynu yn y siop fydd yn gwaethygu neu'n helpu cyflyrau meddygol person. Mae'r arwyneb wedi cael ei chrafu yn unig, ac mae darganfyddiadau mewn data mawr yn digwydd bob wythnos.

Mae Data Mawr yn Fliniog

Monty Rakusen / Getty

Mae data mawr yn ddadansoddiadau rhagfynegol: trosi data anferthiedig anferthiedig i rywbeth y gellir ei chwilio a'i datrys. Mae hwn yn ofnadwy ac anhrefnus sy'n gofyn am fath arbennig o wybodaeth ac amynedd.

Cymerwch, er enghraifft, y gwasanaeth cyflwyno UPS monolithig. Mae'r rhaglenwyr yn UPS yn astudio data o GPS eu gyrwyr a'u ffonau smart i ddadansoddi'r ffyrdd mwyaf effeithlon o addasu i dagfeydd traffig. Mae'r GPS hwn a data ffôn smart yn gargantuan, ac nid ydynt yn barod i'w dadansoddi'n awtomatig. Mae'r data hwn yn deillio o wahanol gronfeydd data GPS a mapiau, trwy wahanol ddyfeisiau caledwedd ffôn smart. Mae dadansoddwyr UPS wedi treulio misoedd yn trosi'r holl ddata hwnnw i mewn i fformat y gellir ei chwilio a'i didoli'n hawdd. Er hynny, mae'r ymdrech wedi bod yn werth chweil. Heddiw, mae UPS wedi arbed dros 8 miliwn o galwyn o danwydd ers iddynt ddechrau defnyddio'r dadansoddiadau data mawr hyn.

Oherwydd bod data mawr yn aflonyddgar ac mae angen cymaint o ymdrech i lanhau a pharatoi ar gyfer defnydd, mae gwyddonwyr data wedi dod yn 'janitors data' ar gyfer yr holl waith tyfryd a wnânt. Deer

Fodd bynnag, mae gwyddoniaeth data mawr a dadansoddiadau rhagfynegol yn gwella bob wythnos. Disgwylwch fod data mawr ar gael yn hawdd i bawb erbyn y flwyddyn 2025.

Onid yw Amdanom Ni'n Ddyfarniad Data Mawr i Preifatrwydd?

Feingersh / Getty

Ydw, os na chaiff ein cyfreithiau a'n hamddiffynfeydd preifatrwydd eu rheoli'n ofalus, yna mae data mawr yn ymwthio i breifatrwydd personol. Fel y mae, mae Google a YouTube a Facebook eisoes yn olrhain eich arferion ar-lein dyddiol . Mae eich ffôn smart a bywyd cyfrifiadurol yn gadael ôl troed digidol bob dydd, ac mae cwmnïau soffistigedig yn astudio'r olion traed hynny.

Mae'r deddfau o gwmpas y data mawr yn esblygu. Mae preifatrwydd yn gyflwr o fod yn rhaid i chi nawr gymryd cyfrifoldeb personol, gan na allwch ei ddisgwyl bellach fel hawl ddiofyn.

Beth allwch chi ei wneud i amddiffyn eich preifatrwydd:

Y cam sengl mwyaf y gallwch ei gymryd yw cloddio'ch arferion dyddiol gan ddefnyddio cysylltiad rhwydwaith VPN . Bydd gwasanaeth VPN yn sgrinio'ch signal fel bod eich hunaniaeth a'ch lleoliad wedi eu cuddio'n rhannol o raeadwyr. Ni fydd hyn yn eich gwneud yn 100% anhysbys, ond bydd VPN yn lleihau'n sylweddol faint y gall y byd arsylwi ar eich arferion ar-lein.

Ble alla i ddysgu mwy am y data mawr?

Monty Raskusen / Getty

Mae data mawr yn beth diddorol i bobl sydd â meddyliau dadansoddol a chariad at dechnoleg. Os dyna chi, yna, yn bendant, ewch i'r dudalen hon o brosiectau data mawr diddorol.