In questu articulu vedemu alcune librerie Python pocu cunnisciute ma assai utili:
Ancu se parechje biblioteche sò dispunibili in pitone per DateTime, aghju trovu Pendulum faciule d'utilizà in ogni operazione di data. Un pendulu hè a mo libreria preferita per u mo usu di ogni ghjornu à u travagliu. Estende u modulu datatime integratu di Python, aghjunghjendu una API più intuitiva per a gestione di i fusi orari è eseguisce operazioni di data è ora cum'è aghjunghje intervalli di tempu, sottrae date, è cunvertisce trà i fusi orari. Fornisce una API simplice è intuitiva per formattà date è ore.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Avete nutatu quandu a lingua straniera prisente in i dati ùn appare micca bè? Questu hè chjamatu Mojibake. Mojibake hè un termu utilizatu per discrìviri testu scrambled o scrambled chì si trova in u risultatu di prublemi di codificazione o decodificazione. Di solitu accade quandu u testu scrittu in una codificazione di caratteri hè incorrectamente decodificata cù una codificazione diversa. A biblioteca ftfy python vi aiuterà à riparà Mojibake, chì hè assai utile in i casi d'usu NLP.
!pip install ftfy
print(ftfy.fix_text('Corregge a frase usendu "ftfy"\x9d.')) print(ftfy.fix_text('-"Nisun prublema cù u testu')) print(ftfy.fix_text('Disturbarà a riflessione ') ))
In più di Mojibake, ftfy riparà codificazioni sbagliate, terminazioni di linea sbagliate è citazioni sbagliate. pò capisce u testu chì hè statu decodificatu cum'è una di e seguenti codificazioni:
Sketch hè un assistente di scrittura di codice AI unicu cuncepitu apposta per l'utilizatori chì travaglianu cù a biblioteca di pandas in Python. Aduprà algoritmi di apprendimentu automaticu per capisce u cuntestu di e dati di l'utilizatore è furnisce suggerimenti di codice pertinenti per fà a manipulazione di dati è e attività di analisi più faciule è più efficiente. Sketch ùn hà micca bisognu di l'utilizatori per installà plugins supplementari in u so IDE, facendu cusì veloce è faciule d'utilizà. Questu pò riduce significativamente u tempu è u sforzu necessariu per i travaglii di dati è aiutanu l'utilizatori à scrive un codice megliu è più efficiente.
!pip install sketch
Avemu bisognu di aghjunghje una estensione .sketch à u quadru di dati Pandas per utilizà sta biblioteca.
Dumandà hè una funzione in Sketch chì permette à l'utilizatori di dumandà dumande nantu à e so dati in un formatu di lingua naturale. Fornisce una risposta basata in testu à a dumanda di l'utilizatori.
# Importazione di biblioteche importate sketch importazione panda cum'è pd # Lettura di e dati (aduprendu i dati di Twitter cum'è un esempiu) df = pd.read_csv ("tweets.csv") print (df)
# Asking quali colonne sò u tipu di categuria df.sketch.ask ("Quali colonne sò u tipu di categuria?")
# Per truvà a forma di u dataframe df.sketch.ask ("Quale hè a forma di u dataframe")
.sketch.cumu
howto hè una funzione chì furnisce un bloccu di codice chì pò esse usatu cum'è puntu di partenza o cunclusione per diverse attività di dati. Pudemu dumandà snippets di codice per nurmalizà e so dati, creà funzioni novi, trama dati, è ancu custruisce mudelli. Stu vi risparmià tempu è fà fàciule à cupià è incollà codice; ùn avete micca à scrive u codice manualmente da zero.
# Domanda di furnisce codice snipped per visualizà l'emozioni df.sketch.howto ("Visualizà l'emozioni")
.sketch.applicà
A funzione .apply aiuta à generà novi funzioni, analizà i campi è eseguisce altre manipulazioni di dati. Per utilizà sta funzione, avemu bisognu di avè un contu OpenAI è aduprà a chjave API per fà e so attività. Ùn aghju micca pruvatu sta funzione.
Mi piaceva aduprà sta biblioteca, in particulare ghjuntu Funziona, è mi pare utile.
"pgeocode" hè una biblioteca eccellente chì aghju scontru recentemente, chì hè stata incredibilmente utile per i mo prughjetti di analisi spaziali. Per esempiu, vi permette di truvà a distanza trà dui codici postali è furnisce infurmazione giugrafica pigliendu un paese è codice postale cum'è input.
!pip install pgeocode
Ottene infurmazione geografica per codici postali specifichi
# Verificate per i nomi di u paese "India" = pgeocode.Nominatim('In') # Ottene infurmazione geografica passendu i codici postali nomes.query_postal_code(["620018", "620017", "620012"])
"pgeocode" calcula a distanza trà dui codici postali pigliendu u paese è i codici postali cum'è input. U risultatu hè spressu in chilometri.
# Truvà una distanza trà dui codici postali distanza = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg hè una altra libreria utile chì elimina facilmente u sfondate da l'imaghjini.
!pip install rembg
# Importazione di biblioteche
da l'importazione di rembg sguassate l'importazione cv2 # percorsu di l'immagine di input (u mo file: image.jpeg) input_path = 'image.jpeg' # percorsu per salvà l'immagine di output è salvà cum'è output.jpeg output_path = 'output.jpeg' # Leghje l'input input di l'imaghjini = cv2.imread (input_path) # Eliminazione di u fondu output = sguassà (input) # Salvà u schedariu cv2.imwrite (output_path, output)
Pudete digià esse familiarizatu cù alcune di queste biblioteche, ma per mè Sketch, Pendulum, pgeocode è ftfy sò indispensabili per u mo travagliu di ingegneria di dati. I cunfidendu assai di elli per i mo prughjetti.
Humanize" furnisce un furmatu di stringa simplice è faciule da leghje per numeri, date è tempi. L'obiettivu di a biblioteca hè di piglià e dati è di rende più user-friendly, per esempiu cunvertisce un numeru di seconde in una stringa più leggibile cum'è "2 minuti fà". A bibliuteca pò furmà dati in parechji manere, cumpresu u furmatu di numeri cù virgule, cunvertisce timestamps in tempi parenti, è più.
Aghju spessu aduprà numeri interi è timestamps per i mo prughjetti di ingegneria di dati.
!pip install humanize
# Importing library import humanize import datetime as dt # Formatting numbers with comma a = humanize.intcomma (951009) # cunvertisce numeri in parolle b = humanize.intword (10046328394) #printing print (a) print (b)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
Sviluppà e cumpetenze di u mutore fine attraversu u culore prepara i zitelli per e cumpetenze più cumplesse cum'è a scrittura. Per culori…
U settore navale hè un veru putere ecunomicu glubale, chì hà navigatu versu un mercatu di 150 miliardi ...
Lunedì, u Financial Times hà annunziatu un accordu cù OpenAI. FT licenze u so ghjurnalismu mundiale ...
Milioni di persone paganu per i servizii di streaming, paghendu tariffi di abbonamentu mensili. Hè una opinione cumuna chì voi ...