Artikel

Endah, tapi perpustakaan Python saeutik-dipikawanoh

Programmer Python sok milarian perpustakaan énggal, anu tiasa ningkatkeun padamelan dina rékayasa data sareng proyék intelijen bisnis.

Dina artikel ieu kami ningali sababaraha pustaka python anu sakedik dipikanyaho, tapi mangpaat pisan:

1. Pendul

Sanajan loba perpustakaan sadia di Python pikeun DateTime, Kuring manggihan Pendulum gampang ngagunakeun dina sagala operasi tanggal. Pendulum mangrupikeun lomari buku karesep kuring pikeun dianggo sapopoé di tempat kerja. Ngalegaan modul datetime Python anu diwangun, nambihan API anu langkung intuitif pikeun ngatur zona waktos sareng ngalaksanakeun operasi tanggal sareng waktos sapertos nambihan interval waktos, ngirangan tanggal, sareng ngarobih antara zona waktos. Nyayogikeun API anu sederhana sareng intuitif pikeun pormat tanggal sareng waktos.

Pamasangan
!pip install pendulum
conto
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
hasil

2. ftfy

Naha anjeun mendakan nalika basa asing dina data henteu némbongan leres? Ieu disebut Mojibake. Mojibake mangrupikeun istilah anu dianggo pikeun ngajelaskeun téks anu garbled atanapi scrambled anu lumangsung salaku hasil tina masalah encoding atanapi decoding. Biasana lumangsung nalika téks anu ditulis nganggo hiji encoding karakter salah dikodekeun nganggo encoding anu béda. Perpustakaan python ftfy bakal ngabantosan anjeun ngalereskeun Mojibake, anu mangpaat pisan dina kasus panggunaan NLP.

Pamasangan
!pip install ftfy
conto
print(ftfy.fix_text('Koréksi kalimah maké “ftfyâ€\x9d.')) print(ftfy.fix_text('✔ Teu aya masalah jeung téks')) print(ftfy.fix_text('à perturber la réflexion '))
hasil

Salian Mojibake, ftfy bakal ngalereskeun encodings goréng, tungtung garis goréng, sarta tanda petik goréng. tiasa ngartos téks anu parantos dikodekeun salaku salah sahiji encodings ieu:

  • Latin-1 (ISO-8859–1)
  • Windows-1252 (cp1252 — dipaké dina produk Microsoft)
  • Windows-1251 (cp1251 — versi Rusia tina cp1252)
  • Windows-1250 (cp1250 — versi Éropa Wétan tina cp1252)
  • ISO-8859–2 (anu teu persis sarua jeung Windows-1250)
  • MacRoman (dipaké dina Mac OS 9 jeung saméméhna)
  • cp437 (dipaké dina MS-DOS sareng sababaraha vérsi paréntah ajakan Windows)

3. Lakukeun

Sketch mangrupikeun asisten coding AI unik anu dirancang khusus pikeun pangguna anu damel sareng perpustakaan pandas di Python. Éta ngagunakeun algoritma pembelajaran mesin pikeun ngartos kontéks data pangguna sareng nyayogikeun saran kode anu relevan pikeun ngajantenkeun manipulasi data sareng tugas analisis langkung gampang sareng langkung éfisién. Sketsa henteu meryogikeun pangguna pikeun masang plug-in tambahan dina IDE na, janten gancang sareng gampang dianggo. Ieu sacara signifikan tiasa ngirangan waktos sareng usaha anu diperyogikeun pikeun tugas anu aya hubunganana sareng data sareng ngabantosan pangguna nyerat kode anu langkung saé, langkung éfisién.

Pamasangan
!pip install sketsa
conto

Urang kudu nambahan hiji extension .sketsa pikeun pandas dataframe ngagunakeun perpustakaan ieu.

.sketsa.nanyakeun

nanya nyaéta fitur Sketsa anu ngamungkinkeun pamaké pikeun nanyakeun ngeunaan data maranéhanana dina format basa alam. Nyadiakeun réspon dumasar téks kana pamundut pamaké.

# Impor perpustakaan ngimpor sketsa impor pandas salaku pd # Maca data (ngagunakeun data twitter sabagé conto) df = pd.read_csv("tweets.csv") print(df)
# Naroskeun kolom mana anu jinis kategori df.sketch.ask ("Kolom mana anu jinis kategori?")
hasil
# Pikeun milarian bentuk dataframe df.sketch.ask("Naon bentuk dataframe")

.sketsa.kumaha

kumaha mangrupa fitur nu nyadiakeun blok kode nu bisa dipaké salaku titik awal atawa tungtung pikeun sagala rupa tugas nu patali jeung data. Urang bisa ménta snippét kode pikeun normalize data maranéhanana, nyieun fitur anyar, lagu data, komo ngawangun model. Ieu bakal ngahemat waktos sareng ngagampangkeun pikeun nyalin sareng nempelkeun kodeu; anjeun teu kudu nulis kode sacara manual ti scratch.

# Naroskeun pikeun nyayogikeun kode anu dipotong pikeun ngagambarkeun émosi df.sketch.howto ("Visualize émosi")
hasil

.sketsa.larapkeun

Fungsi .apply eta mantuan ngahasilkeun fitur anyar, parse widang, sarta ngalakukeun manipulasi data lianna. Pikeun nganggo fitur ieu, urang kedah gaduh akun OpenAI sareng nganggo konci API pikeun ngalaksanakeun tugas. Abdi henteu acan nyobian fitur ieu.

Kuring resep ngagunakeun perpustakaan ieu, khususna datang gawéna, sarta kuring manggihan eta mangpaat.

4. pgeocode

"pgeocode" mangrupikeun perpustakaan anu saé anu nembe kuring kapendak anu parantos mangpaat pisan pikeun proyék analisis spasial kuring. Salaku conto, éta ngamungkinkeun anjeun milarian jarak antara dua kode pos sareng nyayogikeun inpormasi geografis ku cara nyandak nagara sareng kode pos salaku input.

Pamasangan
!pip install pgeocode
conto

Kéngingkeun inpormasi géografis pikeun kode pos khusus

# Mariksa nagara "India" nomi = pgeocode.Nominatim('In') # Meunangkeun inpormasi geo ku cara ngirimkeun kode pos nomi.query_postal_code(["620018", "620017", "620012"])
hasil

"pgeocode" ngitung jarak antara dua postcodes ku cara nyokot nagara jeung postcodes salaku input. Hasilna dinyatakeun dina kilométer.

# Milarian jarak antara dua kode pos jarak = pgeocode.GeoDistance('Dina') distance.query_postal_code("620018", "620012")
hasil

5. rembg

rembg nyaéta perpustakaan mangpaat séjén anu gampang miceun latar tukang tina gambar.

Pamasangan
!pip install rembg
conto
# Ngimpor perpustakaan
ti impor rembg cabut cv2 impor # jalur gambar input (file abdi: image.jpeg) input_path = 'image.jpeg' # jalur pikeun nyimpen gambar kaluaran jeung nyimpen salaku output.jpeg output_path = 'output.jpeg' # Maca input input gambar = cv2.imread(input_path) # Nyoplokkeun kaluaran tukang = miceun(input) # Nyimpen file cv2.imwrite(output_path, output)
hasil

Anjeun meureun geus wawuh jeung sababaraha perpustakaan ieu, tapi keur kuring, Sketsa, Pendulum, pgeocode, sarta ftfy anu indispensable pikeun karya rékayasa data kuring. Kuring ngandelkeun aranjeunna pisan pikeun proyék-proyék kuring.

6. Ngamanusakeun

Humanize "nyadiakeun pormat string anu basajan, gampang dibaca pikeun nomer, kaping, sareng waktos. Tujuan tina perpustakaan nyaéta nyandak data sareng ngajantenkeun langkung ramah-pamaké, contona ku ngarobih sababaraha detik janten senar anu langkung tiasa dibaca sapertos "2 menit ka tukang". Perpustakaan tiasa pormat data ku sababaraha cara, kalebet pormat nomer nganggo koma, ngarobih cap waktos ka waktos relatif, sareng seueur deui.

Kuring sering nganggo integer sareng cap waktu pikeun proyék rékayasa data kuring.

Pamasangan
!pip install humanize
Conto (wilangan bulat)
# Ngimpor perpustakaan impor humanize impor datetime sakumaha dt # Ngaformat angka ku koma a = humanize.intcomma(951009) # ngarobah angka kana kecap b = humanize.intword(10046328394) #printing print(a) print(b)
hasil
Conto (tanggal sareng waktos)
impor humanize impor datetime sakumaha dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

newsletter inovasi
Entong luput warta anu paling penting ngeunaan inovasi. Ngadaptar pikeun nampa aranjeunna ku email.
tags: python

Artikel panganyarna

Masa Depan Ieu Ieu: Kumaha Industri Pengiriman Revolutionizing Ékonomi Global

Sektor angkatan laut mangrupikeun kakuatan ékonomi global anu leres, anu nuju ka arah pasar 150 milyar ...

1 Méi 2024

Penerbit sareng OpenAI nandatanganan perjanjian pikeun ngatur aliran inpormasi anu diolah ku Artificial Intelligence

Senén kamari, Financial Times ngumumkeun deal sareng OpenAI. FT ngalisensikeun jurnalisme kelas dunya na…

April 30 2024

Pamayaran Online: Ieu Kumaha Ladenan Streaming Ngadamel Anjeun Mayar Salamina

Jutaan jalma mayar jasa streaming, mayar biaya langganan bulanan. Pendapat umum yén anjeun…

April 29 2024

Veeam nampilkeun dukungan anu paling komprehensif pikeun ransomware, tina panyalindungan dugi ka réspon sareng pamulihan

Coveware ku Veeam bakal terus nyayogikeun jasa réspon kajadian cyber extortion. Coveware bakal nawiskeun kamampuan forensik sareng remediasi…

April 23 2024