Selles artiklis näeme mõnda vähetuntud, kuid väga kasulikku pythoni teeki:
Kuigi paljud raamatukogud on saadaval Python DateTime jaoks on minu arvates Pendulumi lihtne kasutada mis tahes kuupäevatoimingu puhul. Pendel on minu lemmik raamaturiiul igapäevaseks tööl kasutamiseks. Laiendab sisseehitatud Pythoni kuupäeva-aja moodulit, lisades intuitiivsema API ajavööndite haldamiseks ning kuupäeva ja kellaaja toimingute tegemiseks, nagu ajavahemike lisamine, kuupäevade lahutamine ja ajavööndite vaheline teisendamine. Pakub lihtsat ja intuitiivset API-d kuupäevade ja kellaaegade vormindamiseks.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Kas olete kokku puutunud sellega, et võõrkeel andmetes ei kuvata õigesti? Seda nimetatakse Mojibake'iks. Mojibake on termin, mida kasutatakse kodeerimis- või dekodeerimisprobleemide tagajärjel tekkinud moonutatud või segatud teksti kirjeldamiseks. Tavaliselt juhtub see siis, kui ühe märgikodeeringuga kirjutatud tekst on erineva kodeeringuga valesti dekodeeritud. ftfy pythoni teek aitab teil parandada Mojibake'i, mis on NLP kasutusjuhtudel väga kasulik.
!pip install ftfy
print(ftfy.fix_text('Paranda lauset “ftfyâ€\x9d.')) print(ftfy.fix_text('✔ Tekstiga pole probleeme')) print(ftfy.fix_text('à perturber la rèflexion '))
Lisaks Mojibake'ile parandab ftfy halvad kodeeringud, halvad realõpud ja halvad jutumärgid. võib mõista teksti, mis on dekodeeritud ühena järgmistest kodeeringutest:
Sketch on ainulaadne AI kodeerimisassistent, mis on loodud spetsiaalselt Pythoni pandateegiga töötavatele kasutajatele. See kasutab kasutajaandmete konteksti mõistmiseks masinõppe algoritme ja pakub asjakohaseid koodisoovitusi, et muuta andmetega manipuleerimise ja analüüsi ülesanded lihtsamaks ja tõhusamaks. Sketch ei nõua kasutajatelt oma IDE-sse täiendavate pistikprogrammide installimist, mistõttu on selle kasutamine kiire ja lihtne. See võib oluliselt vähendada andmetega seotud toimingute jaoks kuluvat aega ja vaeva ning aidata kasutajatel kirjutada paremat ja tõhusamat koodi.
!pip installi eskiis
Selle teegi kasutamiseks peame panda andmeraamile lisama laienduse .sketch.
küsima on Sketchi funktsioon, mis võimaldab kasutajatel esitada küsimusi oma andmete kohta loomulikus keeles. Annab kasutaja päringule tekstipõhise vastuse.
# Teekide importimine sketchi import pandade import pd-na # Andmete lugemine (näiteks Twitteri andmetega) df = pd.read_csv("tweets.csv") print(df)
# Küsib, millised veerud on kategooria tüüpi df.sketch.ask("Millised veerud on kategooria tüüpi?")
# Andmeraami kuju leidmiseks df.sketch.ask("Mis on andmeraami kuju")
.sketch.howto
howto on funktsioon, mis pakub koodiplokki, mida saab kasutada erinevate andmetega seotud toimingute algus- või lõpp-punktina. Saame küsida koodilõike nende andmete normaliseerimiseks, uute funktsioonide loomiseks, andmete jälgimiseks ja isegi mudelite loomiseks. See säästab aega ning muudab koodi kopeerimise ja kleepimise lihtsaks; koodi ei pea nullist käsitsi kirjutama.
# Küsib emotsioonide visualiseerimiseks väljalõigatud koodi df.sketch.howto("Visualiseeri emotsioone")
.sketch.apply
Funktsioon .apply see aitab luua uusi funktsioone, sõeluda välju ja teha muid andmetega manipuleerimisi. Selle funktsiooni kasutamiseks peab meil olema OpenAI konto ja kasutama ülesannete täitmiseks API võtit. Ma pole seda funktsiooni proovinud.
Eriti meeldis mulle seda raamatukogu kasutada Tulema see töötab ja minu arvates on see kasulik.
"pgeocode" on suurepärane raamatukogu, mille otsa hiljuti komistasin ja mis on olnud minu ruumianalüüsi projektide jaoks uskumatult kasulik. Näiteks võimaldab see leida kahe sihtnumbri vahelise kauguse ja annab geograafilist teavet, võttes sisendiks riigi ja sihtnumbri.
!pip install pgeocode
Hankige konkreetsete sihtnumbrite geograafilist teavet
# Riigi "India" kontrollimine nomi = pgeocode.Nominatim('In') # Geoinfo hankimine, edastades sihtnumbrid nomi.query_postal_code(["620018", "620017", "620012"])
"Pgeocode" arvutab kahe sihtnumbri vahelise kauguse, võttes sisendiks riigi ja sihtnumbrid. Tulemust väljendatakse kilomeetrites.
# Kahe sihtnumbri vahelise kauguse leidmine kaugus = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg on veel üks kasulik teek, mis eemaldab hõlpsalt piltidelt tausta.
!pip install rembg
# Teekide importimine
from rembg import remove import cv2 # sisendpildi tee (minu fail: image.jpeg) input_path = 'image.jpeg' # väljundpildi salvestamise ja väljundina salvestamise tee.jpeg output_path = 'output.jpeg' # Sisendi lugemine pildi sisend = cv2.imread(sisendtee) # Taustaväljundi eemaldamine = eemalda(sisend) # Faili salvestamine cv2.imwrite(väljundi_tee, väljund)
Võib-olla olete mõnega neist raamatukogudest juba tuttav, kuid minu jaoks on Sketch, Pendulum, pgeocode ja ftfy minu andmetöötluse jaoks asendamatud. Toetun neile oma projektide puhul palju.
Humanize” pakub lihtsat ja hõlpsasti loetavat stringivormingut numbrite, kuupäevade ja kellaaegade jaoks. Teegi eesmärk on võtta andmed ja muuta need kasutajasõbralikumaks, näiteks teisendades sekundite arvu loetavamaks stringiks nagu "2 minutit tagasi". Teek saab andmeid vormindada mitmel viisil, sealhulgas vormindada numbreid komadega, teisendada ajatemplid suhtelisteks aegadeks ja palju muud.
Kasutan oma andmetöötlusprojektides sageli täisarve ja ajatempleid.
!pip install humanize
# Teegi importimine humanize import datetime as dt # Numbrite vormindamine komadega a = humanize.intcomma(951009) # arvude teisendamine sõnadeks b = humanize.intword(10046328394) #printing print(a) print(b)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
Veeami Coveware jätkab küberväljapressimise juhtumitele reageerimise teenuste pakkumist. Coveware pakub kohtuekspertiisi ja heastamisvõimalusi…
Ennustav hooldus muudab nafta- ja gaasisektori pöördeliseks uuendusliku ja ennetava lähenemisega tehaste juhtimisele.…
Ühendkuningriigi CMA on väljastanud hoiatuse Big Techi käitumise kohta tehisintellekti turul. Seal…
Euroopa Liidu poolt hoonete energiatõhususe suurendamiseks koostatud roheliste majade dekreet on lõpetanud oma seadusandliku protsessi…