Dè a th ’anns an Data Science, dè nì e agus dè na h-amasan a th’ ann
Leis an teirm Data Science a’ ciallachadh smachd a tha a’ dèiligeadh ri giullachd agus eadar-mhìneachadh dàta. Smachdachadh Data Science tha e ag èirigh bho cho-fhilleadh mòran eòlais bho Staitistig gu Matamataig, bho Saidheans gu Saidheans Coimpiutaireachd.
La Data Science, no Saidheans Dàta, saidheans an ìre mhath ùr, gu dearbh tha e air a bhith timcheall airson timcheall air leth-cheud bliadhna. Tha e ag èirigh bhon fheum air òrdugh a chuir ann an co-theacsa a tha gu math beothail agus a tha ag atharrachadh gu luath. Tha am fàs ann an tomhas dàta, an comas agus an comas brìgh a thoirt do dhàta, air an Data Science.
Gu h-eachdraidheil, thathas gu tric air dèiligeadh ri dàta mar sheòrsa de thoradh àrd-sgoile de phròiseas sam bith. Tha duine sam bith thar nan linntean air gealltainn dàta a chruinneachadh, air sin a dhèanamh sa mhòr-chuid airson an goireasachd fhèin, gu tric gun a bhith a’ smaoineachadh sin an-diugh dh’ fhaodadh luach eaconamach a bhith air a thoirt do chruinneachadh dàta. Ma tha sinn a’ smaoineachadh, mar eisimpleir, air tuathanas a dh’ fhaodadh a bhith air fiosrachadh a chruinneachadh thairis air na bliadhnaichean mu bhàrr, tachartasan, cur, msaa, is dòcha gun do rinn e sin gus an eachdraidh chorporra aige a thasgadh. Nam biodh a h-uile tuathanas air an dòigh sin a dhèanamh, dh'fhaodadh companaidhean todhair an-diugh buannachd fhaighinn às airson adhbharan rannsachaidh, no airson adhbharan margaidheachd.
Eòlaiche-fiosrachaidh
An neach a tha a 'dèiligeadh Data Science, tha e air a ghairm neach-saidheans dàta: an-dràsta mar aon de na proifeiseantaich as mòr-chòrdte ann an saoghal na h-obrach.
Is e obair an neach-saidheans dàta dàta a mhion-sgrùdadh gus modalan taobh a-staigh a chomharrachadh, is e sin, na tha mi a’ cur an cèill an dàta a tha ri fhaighinn tron ghluasad. Tha comharrachadh nam modalan sin obrachail a rèir adhbharan an neach-dèiligidh: companaidh, buidheann poblach msaa ...
Airgead-airgid
Anns na beagan bhliadhnaichean a dh ’fhalbh, tha modal margaidheachd dàta air e fhèin a stèidheachadh barrachd is barrachd far a bheil ùidh aig cuideigin ann a bhith a’ reic dàta agus cuideigin eile ann a bhith ga cheannach.
Rugadh companaidhean a bha speisealaichte ann an cinneasachadh dàta, agus bha companaidhean gu sònraichte a’ ceannach agus a’ reic às deidh obair glanaidh is ath-ghiollachd iomchaidh. Ma smaoinicheas sinn an uairsin air na riaghailtean prìobhaideachd, tuigidh sinn cho iom-fhillte 'sa tha an cuspair. An-diugh tha laghan teann ann a tha ag iarraidh cleachdadh mothachail agus spèis de fhiosrachadh.
Planadh
Pròiseact de Data Science mar as trice air a dhèanamh suas de na ceumannan a leanas:
- Tuairisgeul air an duilgheadas: tha pròiseact air a bhreith leis an amas toradh a choileanadh, no fuasgladh fhaighinn air duilgheadas. Tha an tuairisgeul seo a’ mìneachadh feartan nan toraidhean a gheibhear, an ùine airson an coileanadh, agus na goireasan a tha rim faighinn;
- Cruinneachadh dàta: gus dèiligeadh ris an duilgheadas, feumar cuid fhaighinn seata dàta, no mar-thà an làthair sa chompanaidh no bho thùsan bhon taobh a-muigh. Dh’ fhaodadh iad sin a bhith nan sgrùdaidhean air-loidhne, dàta air a chruinneachadh bho thùsan sòisealta, msaa. Seo seata dàta bidh e an uair sin air a ghlanadh, air a sgioblachadh agus air a structaradh ann an dòigh is gum bi e na thùs obrach dha na neach-saidheans dàta;
- Mion-sgrùdadh air an dàta tòiseachaidh: aig an ìre seo feumar an dàta fhaicinn agus a sgrùdadh, a shìoladh, a gheàrr-chunntas ann an clàran agus a thaisbeanadh ann an grafaichean. Bidh seo uile ga dhèanamh comasach a feartan, crìochan agus beàrnan sam bith a chomharrachadh;
- Mion-sgrùdadh dàta: is e seo an ìre anns a bheil na modailean air an comharrachadh, a’ cleachdadh nan innealan agus nan dòighean as freagarraiche a rèir nan amasan a tha rin coileanadh;
- Cleachdadh nam Modailean: anns an ìre mu dheireadh seo, leigidh cur an gnìomh nam modalan comharraichte na toraidhean a tha thu ag iarraidh fhaighinn. Seo an neach-saidheans dàta tha e dìreach a’ toirt seachad stiùireadh airson a bhith a’ cleachdadh an seata dàta, agus cur a-mach am fiosrachadh ceart. Feumaidh an stiùireadh seo a bhith air a chur an cèill ann an cànan gnìomhachais a 'chompanaidh, a bhios a' fuasgladh nan duilgheadasan airson an deach am pròiseact a leasachadh.
Anns a h-uile ceum tha an neach-saidheans dàta ag eadar-obrachadh le roinnean companaidh sònraichte, agus mar sin faodaidh sinn a ràdh gu bheil an neach-saidheans dàta air amalachadh gu foirfe a-steach don fhìrinn chorporra.
Le adhartas teicneòlach, tha an neach-saidheans dàta gu tric ga lorg fhèin a’ dèiligeadh ri cùisean Dàta Mòr agus Faireachdainneachaidh Dealain.
Dàta Mòr
Nuair a bhios sinn a’ bruidhinn air Dàta Mòr bidh sinn a’ toirt iomradh air dàta anns a bheil measgachadh mòr, a’ ruighinn ann an tomhas-lìonaidh agus nas luaithe. Canar riaghailt nan trì Vs ris a’ bhun-bheachd seo cuideachd, a tha a’ toirt a-steach taghadh de thrì teirmean a tha a’ comharrachadh iongantas Dàta Mòr anns na feartan riatanach aige:
- volume: oir tha an ìre de dhàta a thèid a phròiseasadh gu math àrd. Is e am bàillidh seo gu cinnteach am fear as comharraiche de na trì, gu dearbh tha am buadhair Mòr air thoiseach air am facal Data. Tha tasglannan Dàta Mòr air an tomhas ann an òrdugh Terabytes no Petabytes;
- luaths: Tha an teirm seo a 'toirt iomradh air an astar leis a bheil dàta air a chruinneachadh. Tha na co-theacsan anns a bheil sruthadh dàta leantainneach, gun stad, a’ sruthadh a-steach don t-seirbheisiche a’ sìor fhàs cumanta. Bidh seo a’ sparradh buileachadh shiostaman a tha comasach air cruinneachadh gun chall dàta, gun bhlocaichean agus a’ lughdachadh amannan latency. Feuch an smaoinich sinn, mar eisimpleir, air gnothaichean ionmhais, malairt air-loidhne, IoT msaa ...
- Varietà: eu-coltach ri tasglannan làn structarail, tha an dàta a tha na phàirt de shiostam BigData glè eadar-dhealaichte. Mar eisimpleir is urrainn dhuinn smaoineachadh air an dàta a tha air a chruinneachadh ann an lìonra sòisealta sam bith: dealbhan, teacsa, ceanglachan, bhideothan.
Gu fìrinneach, chaidh rudan sònraichte eile a chur ris thar ùine, leithid fìrinn an dàta gus earbsachd agus earbsachd an dàta a chomharrachadh.
Tha meud mòr de dhàta a’ ruighinn aig astar mòr, agus air a chomharrachadh le measgachadh mòr, gu riatanach a’ leantainn gu duilgheadasan eagrachadh dàta.
Ciamar a chur air dòigh iad?
A 'cur fàilte orra agus an uairsin gan giullachd? Structar iad agus an uairsin gan giullachd?
Rugadh grunn paradigs de eagrachadh shiostaman dàta, a tha air iad fhèin a stèidheachadh thar ùine:
- Taigh-dàta: Is e sin, tasglann dàta structaraichte. Air a chleachdadh gu farsaing, leis cho sònraichte ‘s a tha e gum feum dàta a bhith air a chuir air dòigh aig an dearbh mhionaid anns an tèid fhaighinn;
- Loch dàta- air a chomharrachadh leis gu bheil a h-uile dàta a thig a-steach air a chuir an dàrna taobh anns a’ bhogsa gun phoileasaidh stòraidh structaraichte. Tha am paradigm mu choinneamh an Datawarehouse, oir anns an Data Lake cha bhith structar an dàta ach nuair a dh’ fheumar an leughadh gus am mìneachadh. Bidh an dòigh-obrach seo a’ sìmpleachadh agus a’ luathachadh na h-ìre togail, a’ dèanamh cron air na h-ìrean a leanas;
- tìoraidh: air an ainmeachadh mar an ceudna compartmentalized. Bidh gach roinn no roinn companaidh a 'cruinneachadh an dàta aca gun a bhith ga roinn le feadhainn eile.
An-dràsta is iad seo na paradigms as fharsainge a thathas a’ cleachdadh, agus ann an iomadh cùis tha fuasgladh amalachaidh ann, ie dh’ fhaodadh pròiseactan eadar-dhealaichte diofar dhòighean cruinneachaidh a chleachdadh agus an uairsin amalachadh nas fhaide air adhart. Dh’ fhaodadh suidheachaidhean a bhith ann far a bheil dàta eadar-dhealaichte air a chruinneachadh le diofar paradigms, no dh’ fhaodadh cruinneachaidhean eadar-dhealaichte a bhith nan ìrean co-chosmhail den aon chuairt-beatha.
Machine Ionnsachadh
A dh'aindeoin cho feumail 's a tha iad, tha fios againn glè mhath gu bheil innealan giullachd, neo coimpiutairean, gòrach. Is e sin, chan eil fios aig coimpiutair ciamar a nì e dad mura dèan mac an duine mion-sgrùdadh air duilgheadas agus gun cruthaich e fuasgladh algorithm agus cuir a-steach e ann am prògram.
Bha seo a-riamh fìor, gus an do thòisich sinn a 'bruidhinn mu dheidhinn Faireachdainneachaidh Dealain. Gu dearbh tha aninntleachd fuadain a 'toirt a-steach a bhith a' toirt a-steach seòrsa de reusanachadh gun spionnadh anns an inneal, a dh'fhaodas a stiùireadh gu bhith a 'fuasgladh dhuilgheadasan gu neo-eisimeileach, is e sin, gun stiùireadh daonna dìreach.
Thug e grunn bhliadhnaichean mus deach an abairt "brosnaich seòrsa de reusanachadh gun spionnadh anns an inneal“, Is e sin, thug e grunn bhliadhnaichean mus deach sinn seachad bho chumha de stiùireadh iomlan“ èignichte ”air an inneal, gu suidheachadh fèin-ionnsachaidh. Ann am faclan eile, tha an inneal air a bhith comasach air fèin-ionnsachadh, ionnsachadh. Mar sin tha sinn air ruighinn Machine Ionnsachadh.
Il Machine Ionnsachadh 's e meur deFaireachdainneachaidh Dealain anns am bi am prògramadair a’ stiùireadh an inneil ann an ìre trèanaidh stèidhichte air sgrùdadh dàta eachdraidheil. Aon uair ‘s gu bheil an ìre trèanaidh seo deiseil, thèid modal a thoirt gu buil a dh’ fhaodar a chuir an sàs ann am fuasgladh cheistean, air a nochdadh gu soilleir le dàta ùr.
An coimeas ris an dòigh-obrach clasaigeach, anns an do dh'obraich an neach-saidheans dàta gus algorithms fuasglaidh a mhìneachadh, gheibh an inneal a-mach dè a tha anns a 'mhodail. Feumaidh an Neach-saidheans Dàta ìrean trèanaidh a tha a’ sìor fhàs èifeachdach a chuir air dòigh, le dàta nas beairtiche agus nas cudromaiche, agus dearbhadh càileachd nam modalan a chaidh a thoirt a-mach le bhith gan toirt gu deuchainnean.
Taing dha Machine Ionnsachadh, tha na siostaman a bhios sinn a’ cleachdadh ann an innealan gluasadach, eadar-lìn, fèin-ghluasad dachaigh (no a rèir coltais) a’ sìor fhàs tuigseach. Mar a bhios siostam ag obair, is dòcha gum bi e comasach dha dàta a chruinneachadh mu dheidhinn fhèin agus an luchd-cleachdaidh a bhios ga chleachdadh, agus an uairsin ga chleachdadh aig ìre trèanaidh gus tuilleadh leasachaidh a dhèanamh air ro-innse.
Ercole Palmeri: Ùr-ghnàthachadh tràilleach