Cùrsaichean python

Tha am prògramadair Python an-còmhnaidh a’ coimhead airson leabharlannan ùra, as urrainn an obair ann an innleadaireachd dàta agus pròiseactan fiosrachaidh gnìomhachais a leasachadh.

San artaigil seo chì sinn cuid de leabharlannan python glè bheag aithnichte, ach glè fheumail:

1. Pendulum

Ged a tha mòran leabharlannan rim faighinn ann an Python airson DateTime, tha mi a’ faicinn Pendulum furasta a chleachdadh air gnìomhachd ceann-latha sam bith. Is e pendulum am bùth leabhraichean as fheàrr leam airson mo chleachdadh làitheil aig an obair. A’ leudachadh modal ceann-latha Python amalaichte, a’ cur API nas intuitive ris airson a bhith a’ riaghladh sònaichean ùine agus a’ coileanadh obrachaidhean ceann-latha is ùine leithid cur ris raointean ùine, toirt air falbh cinn-latha, agus tionndadh eadar sònaichean ùine. Tha e a’ toirt seachad API sìmplidh agus intuitive airson cinn-latha agus amannan a chruth.

Stàladh
!pip install pendulum
mar eisimpleir
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Species

2. ftfy

An do mhothaich thu nuair nach eil an cànan cèin a tha an làthair anns an dàta a’ nochdadh ceart? Canar Mojibake ris an seo. Is e teirm a th’ ann am Mojibake a thathar a’ cleachdadh airson cunntas a thoirt air teacsa garbled no scrambled a tha a’ tachairt mar thoradh air duilgheadasan còdaidh no dì-chòdaidh. Mar as trice bidh e a’ tachairt nuair a tha teacsa sgrìobhte ann an còdachadh aon charactar air a chòdachadh gu ceàrr a’ cleachdadh còdachadh eile. An leabharlann ftfy python cuidichidh e thu gus Mojibake a chàradh, a tha glè fheumail ann an cùisean cleachdaidh NLP.

Stàladh
!pip stàlaich ftfy
mar eisimpleir
print(ftfy.fix_text('Ceartaich an seantans a' cleachdadh 'ftfy'\x9d.')) print(ftfy.fix_text('âœ" Gun duilgheadas le teacsa')) print(ftfy.fix_text('perturber la réflexion) '))
Species

A bharrachd air Mojibake, socraichidh ftfy droch chòdaidhean, droch chrìochnaidhean loidhne, agus droch luachan. is dòcha gun tuig iad teacsa a chaidh a chòdachadh mar aon de na còdan a leanas:

  • Laideann-1 (ISO-8859–1)
  • Windows-1252 (cp1252 - air a chleachdadh ann am bathar Microsoft)
  • Windows-1251 (cp1251 - an tionndadh Ruiseanach de cp1252)
  • Windows-1250 (cp1250 - an dreach Eòrpach an Ear de cp1252)
  • ISO-8859-2 (nach eil dìreach an aon rud ri Windows-1250)
  • MacRoman (air a chleachdadh air Mac OS 9 agus nas tràithe)
  • cp437 (air a chleachdadh ann an MS-DOS agus cuid de dhreachan den òrdugh Windows gu sgiobalta)

3. Sgeidse

Tha Sketch na neach-taic sgrìobhaidh còd AI sònraichte a chaidh a dhealbhadh gu sònraichte airson luchd-cleachdaidh a tha ag obair leis na pandathan san leabharlann Python. Bidh e a’ cleachdadh algorithms ionnsachadh inneal gus co-theacsa dàta an neach-cleachdaidh a thuigsinn agus a’ toirt seachad molaidhean còd buntainneach gus gnìomhan làimhseachadh dàta agus mion-sgrùdadh a dhèanamh nas fhasa agus nas èifeachdaiche. Chan eil Sgeidse ag iarraidh air luchd-cleachdaidh plugins a bharrachd a chuir a-steach san IDE aca, ga dhèanamh luath agus furasta a chleachdadh. Faodaidh seo lùghdachadh mòr a thoirt air an ùine agus an oidhirp a tha a dhìth airson gnìomhan co-cheangailte ri dàta agus luchd-cleachdaidh a chuideachadh gus còd nas fheàrr agus nas èifeachdaiche a sgrìobhadh.

Stàladh
!pip stàlaich sgeidse
mar eisimpleir

Feumaidh sinn leudachadh .sketch a chur ri pandas dataframe gus an leabharlann seo a chleachdadh.

.sgeidse.faighnich

faighnich na fheart de Sgeidse a leigeas le luchd-cleachdaidh ceistean fhaighneachd mun dàta aca ann an cruth cànain nàdarra. A’ toirt seachad freagairt stèidhichte air teacsa do cheist an neach-cleachdaidh.

# Le bhith a’ toirt a-steach leabharlannan in-mhalairt sgeidse pandathan mar pd # A’ leughadh an dàta (a’ cleachdadh dàta twitter mar eisimpleir) df = pd.read_csv (“tweets.csv”) print(df)
# A’ faighneachd dè na colbhan a tha ann an seòrsa roinn-seòrsa df.sketch.ask (“Dè na colbhan a tha ann an seòrsa roinn?”)
Species
# Gus cumadh an fhrèam-dàta a lorg df.sketch.ask (“Dè an cumadh a th’ air an fhrèam dàta”)

.sgeidse.howto

Ciamar na fheart a bheir seachad bloc de chòd a dh'fhaodar a chleachdadh mar àite tòiseachaidh no crìochnachaidh airson diofar ghnìomhan co-cheangailte ri dàta. Faodaidh sinn criomagan de chòd iarraidh gus an dàta aca a dhèanamh àbhaisteach, feartan ùra a chruthachadh, lorg dàta, agus eadhon modalan a thogail. Sàbhalaidh seo ùine agus nì e furasta an còd a chopaigeadh agus a phasgadh; chan fheum thu an còd a sgrìobhadh le làimh bhon toiseach.

# Ag iarraidh còd a thoirt seachad airson na faireachdainnean fhaicinn df.sketch.howto (“Fradharc air na faireachdainnean”)
Species

.sgeidse.apply

An gnìomh .apply bidh e a’ cuideachadh le bhith a’ gineadh feartan ùra, a’ parsadh raointean, agus a’ dèanamh làimhseachadh dàta eile. Gus am feart seo a chleachdadh, feumaidh cunntas OpenAI a bhith againn agus an iuchair API a chleachdadh gus na gnìomhan a choileanadh. Chan eil mi air am feart seo fheuchainn.

Chòrd e rium a bhith a’ cleachdadh an leabharlann seo, gu sònraichte tighinn tha e ag obair, agus tha e feumail dhomh.

4. pgeocode

Tha “pgeocode” na dheagh leabharlann air an do ghabh mi o chionn ghoirid a tha air a bhith air leth feumail airson na pròiseactan anailis spàsail agam. Mar eisimpleir, leigidh e leat an astar eadar dà chòd puist a lorg agus bheir e seachad fiosrachadh cruinn-eòlasach le bhith a’ gabhail dùthaich agus còd-puist mar chur-a-steach.

Stàladh
!pip stàlaich pgeocode
mar eisimpleir

Faigh fiosrachadh cruinn-eòlasach airson còdan-puist sònraichte

# A’ sgrùdadh airson dùthaich “India” nomi = pgeocode.Nominatim('In') # A’ faighinn fiosrachadh geo le bhith a’ dol seachad air na còdan-puist nomi.query_postal_code(["620018", "620017", "620012"])
Species

Bidh “pgeocode” a’ tomhas an astair eadar dà chòd-puist le bhith a’ toirt na dùthcha agus còdan-puist mar chur-a-steach. Tha an toradh air a chuir an cèill ann an cilemeatairean.

# Lorg astar eadar dà chòd-puist astar = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
Species

5. rembg

rembg na leabharlann feumail eile a bheir air falbh an cùl-raon bho ìomhaighean gu furasta.

Stàladh
!pip stàlaich rembg
mar eisimpleir
# Cuir a-steach leabharlannan
from rembg import remove import cv2 # path of input image (my file: image.jpeg) input_path = 'image.jpeg' # path for saving output image and saving as a output.jpeg output_path = 'output.jpeg' # Reading the input cuir a-steach ìomhaigh = cv2.imread(input_path) # A’ toirt air falbh toradh cùl-fhiosrachaidh = thoir air falbh (cuir a-steach) # Sàbhaladh faidhle cv2.imwrite(output_path, toradh)
Species

Is dòcha gu bheil thu eòlach air cuid de na leabharlannan sin mu thràth, ach dhòmhsa, tha Sgeidse, Pendulum, pgeocode, agus ftfy riatanach airson an obair innleadaireachd dàta agam. Tha mi gu mòr an urra riutha airson mo phròiseactan.

6. Daonnachd

Humanize" a’ toirt seachad cruth sreang sìmplidh, furasta a leughadh airson àireamhan, cinn-latha agus amannan. 'S e amas an leabharlainn an dàta a ghabhail agus a dhèanamh nas fhasa a chleachdadh, mar eisimpleir le bhith a' tionndadh grunn dhiogan gu sreang a tha furasta a leughadh mar "2 mhionaid air ais". Faodaidh an leabharlann dàta a chruth ann an diofar dhòighean, a’ gabhail a-steach a bhith a’ cruth àireamhan le cromagan, ag atharrachadh chlàran-ama gu amannan coimeasach, agus barrachd.

Bidh mi gu tric a’ cleachdadh àireamhan agus clàran-ama airson na pròiseactan innleadaireachd dàta agam.

Stàladh
!pip stàlaich humanize
Eisimpleir (Integers)
# A’ toirt a-steach in-mhalairt leabharlainn, ceann-latha in-mhalairt humanize mar dt # Cruthachadh àireamhan le cromag a = humanize.intcoma(951009) # ag iompachadh àireamhan gu faclan b = humanize.intword(10046328394) #printing print(a) print(b)
Species
Eisimpleir (ceann-latha agus uair)
cuir a-steach ceann-latha in-mhalairt humanize mar dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

Autore