Artikoli

Libreriji Python tal-għaġeb, iżda ftit magħrufa

Il-programmatur Python dejjem qed ifittex libreriji ġodda, li jistgħu jtejbu x-xogħol fil-proġetti ta 'inġinerija tad-dejta u intelliġenza tan-negozju.

F'dan l-artikolu naraw xi libreriji python ftit magħrufa, iżda utli ħafna:

1. Pendlu

Għalkemm ħafna libreriji huma disponibbli fi Python għal DateTime, insib Pendulum faċli biex tużah fuq kwalunkwe operazzjoni tad-data. Pendlu huwa bookcase favorit tiegħi għall-użu tiegħi ta 'kuljum fuq ix-xogħol. Jestendi l-modulu Python datetime inkorporat, billi żżid API aktar intuwittivi għall-ġestjoni taż-żoni tal-ħin u t-twettiq ta 'operazzjonijiet ta' data u ħin bħaż-żieda ta 'intervalli ta' ħin, it-tnaqqis tad-dati, u l-konverżjoni bejn iż-żoni tal-ħin. Jipprovdi API sempliċi u intuwittivi għall-ifformattjar tad-dati u l-ħinijiet.

Installazzjoni
!pip install pendulum
eżempju
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
output

2. ftfy

Iltqajt ma' meta l-lingwa barranija fid-dejta ma tidhirx b'mod korrett? Dan jissejjaħ Mojibake. Mojibake huwa terminu użat biex jiddeskrivi test imgħawweġ jew scrambled li jseħħ bħala riżultat ta 'problemi ta' kodifikazzjoni jew dekodifikazzjoni. Normalment iseħħ meta test miktub b'kodifikazzjoni ta' karattru wieħed ikun dekodifikat b'mod żbaljat bl-użu ta' kodifikazzjoni differenti. Il-librerija ftfy python tgħinek tiffissa Mojibake, li huwa utli ħafna f'każijiet ta 'użu NLP.

Installazzjoni
!pip install ftfy
eżempju
print(ftfy.fix_text('Ikkoreġi s-sentenza billi tuża “ftfyâ€\x9d.')) print(ftfy.fix_text('✔ Ebda problemi bit-test')) print(ftfy.fix_text('à perturber la réflexion). '))
output

Minbarra Mojibake, ftfy se jiffissa kodifikazzjonijiet ħżiena, truf tal-linji ħżiena, u kwotazzjonijiet ħżiena. jista' jifhem test li ġie dekodifikat bħala waħda mill-kodifikazzjonijiet li ġejjin:

  • Latin-1 (ISO-8859–1)
  • Windows-1252 (cp1252 — użat fil-prodotti Microsoft)
  • Windows-1251 (cp1251 — il-verżjoni Russa ta' cp1252)
  • Windows-1250 (cp1250 — il-verżjoni tal-Lvant tal-Ewropa ta' cp1252)
  • ISO-8859–2 (li mhuwiex eżattament l-istess bħal Windows-1250)
  • MacRoman (użat fuq Mac OS 9 u preċedenti)
  • cp437 (użat fl-MS-DOS u xi verżjonijiet tal-prompt tal-kmand tal-Windows)

3. Skeċċ

Sketch huwa assistent uniku għall-kodifikazzjoni AI iddisinjat speċifikament għall-utenti li jaħdmu mal-librerija tal-pandas f'Python. Juża algoritmi ta’ tagħlim tal-magni biex jifhem il-kuntest tad-dejta tal-utent u jipprovdi suġġerimenti ta’ kodiċi rilevanti biex il-manipulazzjoni tad-dejta u l-kompiti tal-analiżi jsiru aktar faċli u effiċjenti. Sketch ma jirrikjedix li l-utenti jinstallaw xi plug-ins addizzjonali fl-IDE tagħhom, li jagħmilha ta' malajr u faċli biex tużah. Dan jista' jnaqqas b'mod sinifikanti l-ħin u l-isforz meħtieġ għall-kompiti relatati mad-dejta u jgħin lill-utenti jiktbu kodiċi aħjar u aktar effiċjenti.

Installazzjoni
!pip install sketch
eżempju

Irridu nżidu estensjoni .sketch mad-dataframe tal-pandas biex nużaw din il-librerija.

.skeċċ.istaqsi

titlob hija karatteristika ta' Sketch li tippermetti lill-utenti jistaqsu mistoqsijiet dwar id-dejta tagħhom f'format ta' lingwa naturali. Jipprovdi tweġiba bbażata fuq test għall-mistoqsija tal-utent.

# L-importazzjoni tal-libreriji timporta skeċċ importazzjoni pandas bħala pd # Qari tad-dejta (bl-użu tad-dejta ta’ twitter bħala eżempju) df = pd.read_csv("tweets.csv") print(df)
# Tistaqsi liema kolonni huma tat-tip tal-kategorija df.sketch.ask ("Liema kolonni huma tat-tip tal-kategorija?")
output
# Biex issib il-forma tad-dataframe df.sketch.ask ("X'inhi l-forma tad-dataframe")

.skeċċ.kif

howto hija karatteristika li tipprovdi blokk ta 'kodiċi li jista' jintuża bħala punt tal-bidu jew tat-tmiem għal diversi kompiti relatati mad-dejta. Nistgħu nitolbu snippets ta' kodiċi biex jinnormalizzaw id-dejta tagħhom, joħolqu karatteristiċi ġodda, intraċċaw id-dejta, u saħansitra nibnu mudelli. Dan jiffranka l-ħin u jagħmilha faċli biex tikkopja u tippejstja l-kodiċi; m'għandekx għalfejn tikteb il-kodiċi manwalment mill-bidu.

# Titlob biex tipprovdi kodiċi snipped għall-viżwalizzazzjoni tal-emozzjonijiet df.sketch.howto ("Viżwalizza l-emozzjonijiet")
output

.skeċċ.applika

Il-funzjoni .apply tgħin biex tiġġenera karatteristiċi ġodda, teżamina oqsma, u twettaq manipulazzjonijiet oħra tad-dejta. Biex nużaw din il-karatteristika, jeħtieġ li jkollna kont OpenAI u nużaw iċ-ċavetta API biex twettaq il-kompiti. Jien ma ppruvajtx din il-karatteristika.

Ħadt gost nuża din il-librerija, speċjalment Come jaħdem, u nsibha utli.

4. pgeocode

"pgeocode" hija librerija eċċellenti li reċentement tfixkel u li kienet utli oerhört għall-proġetti tiegħi ta 'analiżi spazjali. Pereżempju, jippermettilek issib id-distanza bejn żewġ kodiċi postali u tipprovdi informazzjoni ġeografika billi tieħu pajjiż u kodiċi postali bħala input.

Installazzjoni
!pip jinstalla pgeocode
eżempju

Ikseb informazzjoni ġeografika għal kodiċi postali speċifiċi

# Iċċekkja għall-pajjiż "India" nomi = pgeocode.Nominatim('In') # Ikseb informazzjoni ġeografika billi tgħaddi l-kodiċi postali nomi.query_postal_code(["620018", "620017", "620012"])
output

“pgeocode” tikkalkula d-distanza bejn żewġ kodiċi postali billi tieħu l-pajjiż u l-kodiċi postali bħala input. Ir-riżultat huwa espress f'kilometri.

# Sib distanza bejn żewġ kodiċi postali distanza = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
output

5. rembg

rembg hija librerija utli oħra li faċilment tneħħi l-isfond mill-immaġini.

Installazzjoni
!pip install rembg
eżempju
# L-importazzjoni tal-libreriji
mill-importazzjoni rembg neħħi l-importazzjoni cv2 # path of input image (fajl tiegħi: image.jpeg) input_path = 'image.jpeg' # path for saving output image and seving as a output.jpeg output_path = 'output.jpeg' # Qari tal-input input tal-immaġini = cv2.imread(input_path) # Tneħħija tal-isfond output = neħħi(input) # Iffrankar tal-fajl cv2.imwrite(output_path, output)
output

Inti tista 'diġà tkun familjari ma' xi wħud minn dawn il-libreriji, iżda għalija, Sketch, Pendulum, pgeocode, u ftfy huma indispensabbli għax-xogħol tiegħi ta 'inġinerija tad-dejta. Jien niddependi ħafna fuqhom għall-proġetti tiegħi.

6. Umanizza

Humanize” jipprovdi ifformattjar ta’ string sempliċi u faċli biex jinqara għal numri, dati u ħinijiet. L-għan tal-librerija huwa li tieħu d-dejta u tagħmilha aktar faċli għall-utent, pereżempju billi tikkonverti numru ta 'sekondi f'sekwenza aktar li tinqara bħal "2 minuti ilu". Il-librerija tista' tifformattja d-dejta f'varjetà ta' modi, inkluż ifformattjar ta' numri bil-virgoli, tikkonverti timestamps għal ħinijiet relattivi, u aktar.

Spiss nuża numri interi u timestamps għall-proġetti tiegħi ta' inġinerija tad-dejta.

Installazzjoni
!pip install humanize
Eżempju (Numeri interi)
# Importazzjoni tal-librerija importazzjoni humanize import datetime bħala dt # Formatting numri bil-virgola a = humanize.intcomma(951009) # konverżjoni ta 'numri fi kliem b = humanize.intword(10046328394) #printing print(a) print(b)
output
Eżempju (data u ħin)
importazzjoni humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

Newsletter dwar l-innovazzjoni
Titlifx l-aktar aħbarijiet importanti dwar l-innovazzjoni. Irreġistra biex tirċevihom bl-email.
Tags: python

Artikoli riċenti

Il-Futur qiegħed Hawnhekk: Kif l-Industrija tat-Tbaħħir qed tirrivoluzzjona l-Ekonomija Globali

Is-settur navali huwa qawwa ekonomika globali vera, li navigat lejn suq ta’ 150 biljun...

1 Mejju 2024

Il-pubblikaturi u l-OpenAI jiffirmaw ftehimiet biex jirregolaw il-fluss tal-informazzjoni pproċessata mill-Intelliġenza Artifiċjali

It-Tnejn li għadda, il-Financial Times ħabbret ftehim mal-OpenAI. FT tagħti liċenzja għall-ġurnaliżmu ta’ klassi dinjija tagħha...

April 30 2024

Ħlasijiet Online: Hawn Kif Is-Servizzi ta' Streaming Jagħmel Inti Tħallas Għal Dejjem

Miljuni ta 'nies iħallsu għal servizzi ta' streaming, iħallsu miżati ta 'abbonament ta' kull xahar. Hija opinjoni komuni li inti...

April 29 2024

Veeam għandu l-aktar appoġġ komprensiv għar-ransomware, mill-protezzjoni għar-rispons u l-irkupru

Coveware minn Veeam se jkompli jipprovdi servizzi ta' rispons għal inċidenti ta' estorsjoni ċibernetika. Coveware se joffri forensiċi u kapaċitajiet ta' rimedju...

April 23 2024