F'dan l-artikolu naraw xi libreriji python ftit magħrufa, iżda utli ħafna:
Għalkemm ħafna libreriji huma disponibbli fi Python għal DateTime, insib Pendulum faċli biex tużah fuq kwalunkwe operazzjoni tad-data. Pendlu huwa bookcase favorit tiegħi għall-użu tiegħi ta 'kuljum fuq ix-xogħol. Jestendi l-modulu Python datetime inkorporat, billi żżid API aktar intuwittivi għall-ġestjoni taż-żoni tal-ħin u t-twettiq ta 'operazzjonijiet ta' data u ħin bħaż-żieda ta 'intervalli ta' ħin, it-tnaqqis tad-dati, u l-konverżjoni bejn iż-żoni tal-ħin. Jipprovdi API sempliċi u intuwittivi għall-ifformattjar tad-dati u l-ħinijiet.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Iltqajt ma' meta l-lingwa barranija fid-dejta ma tidhirx b'mod korrett? Dan jissejjaħ Mojibake. Mojibake huwa terminu użat biex jiddeskrivi test imgħawweġ jew scrambled li jseħħ bħala riżultat ta 'problemi ta' kodifikazzjoni jew dekodifikazzjoni. Normalment iseħħ meta test miktub b'kodifikazzjoni ta' karattru wieħed ikun dekodifikat b'mod żbaljat bl-użu ta' kodifikazzjoni differenti. Il-librerija ftfy python tgħinek tiffissa Mojibake, li huwa utli ħafna f'każijiet ta 'użu NLP.
!pip install ftfy
print(ftfy.fix_text('Ikkoreġi s-sentenza billi tuża “ftfyâ€\x9d.')) print(ftfy.fix_text('✔ Ebda problemi bit-test')) print(ftfy.fix_text('à perturber la réflexion). '))
Minbarra Mojibake, ftfy se jiffissa kodifikazzjonijiet ħżiena, truf tal-linji ħżiena, u kwotazzjonijiet ħżiena. jista' jifhem test li ġie dekodifikat bħala waħda mill-kodifikazzjonijiet li ġejjin:
Sketch huwa assistent uniku għall-kodifikazzjoni AI iddisinjat speċifikament għall-utenti li jaħdmu mal-librerija tal-pandas f'Python. Juża algoritmi ta’ tagħlim tal-magni biex jifhem il-kuntest tad-dejta tal-utent u jipprovdi suġġerimenti ta’ kodiċi rilevanti biex il-manipulazzjoni tad-dejta u l-kompiti tal-analiżi jsiru aktar faċli u effiċjenti. Sketch ma jirrikjedix li l-utenti jinstallaw xi plug-ins addizzjonali fl-IDE tagħhom, li jagħmilha ta' malajr u faċli biex tużah. Dan jista' jnaqqas b'mod sinifikanti l-ħin u l-isforz meħtieġ għall-kompiti relatati mad-dejta u jgħin lill-utenti jiktbu kodiċi aħjar u aktar effiċjenti.
!pip install sketch
Irridu nżidu estensjoni .sketch mad-dataframe tal-pandas biex nużaw din il-librerija.
titlob hija karatteristika ta' Sketch li tippermetti lill-utenti jistaqsu mistoqsijiet dwar id-dejta tagħhom f'format ta' lingwa naturali. Jipprovdi tweġiba bbażata fuq test għall-mistoqsija tal-utent.
# L-importazzjoni tal-libreriji timporta skeċċ importazzjoni pandas bħala pd # Qari tad-dejta (bl-użu tad-dejta ta’ twitter bħala eżempju) df = pd.read_csv("tweets.csv") print(df)
# Tistaqsi liema kolonni huma tat-tip tal-kategorija df.sketch.ask ("Liema kolonni huma tat-tip tal-kategorija?")
# Biex issib il-forma tad-dataframe df.sketch.ask ("X'inhi l-forma tad-dataframe")
.skeċċ.kif
howto hija karatteristika li tipprovdi blokk ta 'kodiċi li jista' jintuża bħala punt tal-bidu jew tat-tmiem għal diversi kompiti relatati mad-dejta. Nistgħu nitolbu snippets ta' kodiċi biex jinnormalizzaw id-dejta tagħhom, joħolqu karatteristiċi ġodda, intraċċaw id-dejta, u saħansitra nibnu mudelli. Dan jiffranka l-ħin u jagħmilha faċli biex tikkopja u tippejstja l-kodiċi; m'għandekx għalfejn tikteb il-kodiċi manwalment mill-bidu.
# Titlob biex tipprovdi kodiċi snipped għall-viżwalizzazzjoni tal-emozzjonijiet df.sketch.howto ("Viżwalizza l-emozzjonijiet")
.skeċċ.applika
Il-funzjoni .apply tgħin biex tiġġenera karatteristiċi ġodda, teżamina oqsma, u twettaq manipulazzjonijiet oħra tad-dejta. Biex nużaw din il-karatteristika, jeħtieġ li jkollna kont OpenAI u nużaw iċ-ċavetta API biex twettaq il-kompiti. Jien ma ppruvajtx din il-karatteristika.
Ħadt gost nuża din il-librerija, speċjalment Come jaħdem, u nsibha utli.
"pgeocode" hija librerija eċċellenti li reċentement tfixkel u li kienet utli oerhört għall-proġetti tiegħi ta 'analiżi spazjali. Pereżempju, jippermettilek issib id-distanza bejn żewġ kodiċi postali u tipprovdi informazzjoni ġeografika billi tieħu pajjiż u kodiċi postali bħala input.
!pip jinstalla pgeocode
Ikseb informazzjoni ġeografika għal kodiċi postali speċifiċi
# Iċċekkja għall-pajjiż "India" nomi = pgeocode.Nominatim('In') # Ikseb informazzjoni ġeografika billi tgħaddi l-kodiċi postali nomi.query_postal_code(["620018", "620017", "620012"])
“pgeocode” tikkalkula d-distanza bejn żewġ kodiċi postali billi tieħu l-pajjiż u l-kodiċi postali bħala input. Ir-riżultat huwa espress f'kilometri.
# Sib distanza bejn żewġ kodiċi postali distanza = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg hija librerija utli oħra li faċilment tneħħi l-isfond mill-immaġini.
!pip install rembg
# L-importazzjoni tal-libreriji
mill-importazzjoni rembg neħħi l-importazzjoni cv2 # path of input image (fajl tiegħi: image.jpeg) input_path = 'image.jpeg' # path for saving output image and seving as a output.jpeg output_path = 'output.jpeg' # Qari tal-input input tal-immaġini = cv2.imread(input_path) # Tneħħija tal-isfond output = neħħi(input) # Iffrankar tal-fajl cv2.imwrite(output_path, output)
Inti tista 'diġà tkun familjari ma' xi wħud minn dawn il-libreriji, iżda għalija, Sketch, Pendulum, pgeocode, u ftfy huma indispensabbli għax-xogħol tiegħi ta 'inġinerija tad-dejta. Jien niddependi ħafna fuqhom għall-proġetti tiegħi.
Humanize” jipprovdi ifformattjar ta’ string sempliċi u faċli biex jinqara għal numri, dati u ħinijiet. L-għan tal-librerija huwa li tieħu d-dejta u tagħmilha aktar faċli għall-utent, pereżempju billi tikkonverti numru ta 'sekondi f'sekwenza aktar li tinqara bħal "2 minuti ilu". Il-librerija tista' tifformattja d-dejta f'varjetà ta' modi, inkluż ifformattjar ta' numri bil-virgoli, tikkonverti timestamps għal ħinijiet relattivi, u aktar.
Spiss nuża numri interi u timestamps għall-proġetti tiegħi ta' inġinerija tad-dejta.
!pip install humanize
# Importazzjoni tal-librerija importazzjoni humanize import datetime bħala dt # Formatting numri bil-virgola a = humanize.intcomma(951009) # konverżjoni ta 'numri fi kliem b = humanize.intword(10046328394) #printing print(a) print(b)
importazzjoni humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
Is-settur navali huwa qawwa ekonomika globali vera, li navigat lejn suq ta’ 150 biljun...
It-Tnejn li għadda, il-Financial Times ħabbret ftehim mal-OpenAI. FT tagħti liċenzja għall-ġurnaliżmu ta’ klassi dinjija tagħha...
Miljuni ta 'nies iħallsu għal servizzi ta' streaming, iħallsu miżati ta 'abbonament ta' kull xahar. Hija opinjoni komuni li inti...
Coveware minn Veeam se jkompli jipprovdi servizzi ta' rispons għal inċidenti ta' estorsjoni ċibernetika. Coveware se joffri forensiċi u kapaċitajiet ta' rimedju...