Í þessari grein sjáum við nokkur lítt þekkt, en mjög gagnleg python bókasöfn:
Þótt mörg bókasöfn séu fáanleg í Python fyrir DateTime finnst mér Pendulum auðvelt að nota við hvaða dagsetningaraðgerð sem er. Pendúll er uppáhalds bókaskápurinn minn til daglegra nota í vinnunni. Framlengir innbyggðu Python datetime eininguna, bætir við leiðandi API til að stjórna tímabeltum og framkvæma dagsetningar- og tímaaðgerðir eins og að bæta við tímabilum, draga frá dagsetningum og breyta á milli tímabelta. Veitir einfalt og leiðandi API til að forsníða dagsetningar og tíma.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Hefur þú lent í því þegar erlenda tungumálið í gögnunum birtist ekki rétt? Þetta er kallað Mojibake. Mojibake er hugtak sem notað er til að lýsa brengluðum eða spænum texta sem verður til vegna kóðun eða umskráningarvandamála. Það gerist venjulega þegar texti skrifaður með einum stafakóðun er rangt afkóðaður með annarri kóðun. ftfy python bókasafnið mun hjálpa þér að laga Mojibake, sem er mjög gagnlegt í NLP notkunartilfellum.
!pip setja upp ftfy
print(ftfy.fix_text('Leiðréttu setninguna með “ftfyâ€\x9d.')) print(ftfy.fix_text('✓ Engin vandamál með texta')) print(ftfy.fix_text('à perturber la réflexion '))
Til viðbótar við Mojibake mun ftfy laga slæmar kóðun, slæmar línuendingar og slæmar tilvitnanir. gæti skilið texta sem hefur verið afkóðaður sem ein af eftirfarandi kóðun:
Sketch er einstakur AI kóðunaraðstoðarmaður hannaður sérstaklega fyrir notendur sem vinna með pandasasafnið í Python. Það notar reiknirit fyrir vélanám til að skilja samhengi notendagagna og gefur viðeigandi kóðatillögur til að gera gagnavinnslu og greiningarverkefni auðveldari og skilvirkari. Sketch krefst þess ekki að notendur setji upp neinar viðbótarviðbætur í IDE þeirra, sem gerir það fljótlegt og auðvelt í notkun. Þetta getur dregið verulega úr þeim tíma og fyrirhöfn sem þarf til gagnatengdra verkefna og hjálpað notendum að skrifa betri og skilvirkari kóða.
!pip uppsetningarskissu
Við þurfum að bæta .sketch viðbót við pandas dataframe til að nota þetta bókasafn.
spyrja er eiginleiki Sketch sem gerir notendum kleift að spyrja spurninga um gögn sín á náttúrulegu sniði. Veitir textabundið svar við fyrirspurn notandans.
# Flytja inn bókasöfn flytur inn skissuinnflutning panda sem pdf # Að lesa gögnin (með því að nota Twitter gögn sem dæmi) df = pd.read_csv("tweets.csv") print(df)
# Að spyrja hvaða dálkar eru flokkategund df.sketch.ask("Hvaða dálkar eru flokkagerð?")
# Til að finna lögun gagnarammans df.sketch.ask("Hver er lögun gagnarammans")
.skissa.hvernig
hvernig á að er eiginleiki sem veitir kóðablokk sem hægt er að nota sem upphafs- eða endapunkt fyrir ýmis gagnatengd verkefni. Við getum beðið um kóðabúta til að staðla gögnin þeirra, búa til nýja eiginleika, fylgjast með gögnum og jafnvel smíða líkön. Þetta mun spara tíma og gera það auðvelt að afrita og líma kóðann; þú þarft ekki að skrifa kóðann handvirkt frá grunni.
# Að biðja um að útvega kóða sem er klipptur til að sjá tilfinningarnar df.sketch.howto("Sjáðu tilfinningarnar")
.skissa.beita
.apply aðgerðin það hjálpar til við að búa til nýja eiginleika, flokka reiti og framkvæma aðrar gagnameðferðir. Til að nota þennan eiginleika þurfum við að hafa OpenAI reikning og nota API lykilinn til að framkvæma verkefnin. Ég hef ekki prófað þennan eiginleika.
Ég naut þess að nota þetta bókasafn, sérstaklega Komið það virkar og mér finnst það gagnlegt.
„pgeocode“ er frábært bókasafn sem ég rakst á nýlega sem hefur verið ótrúlega gagnlegt fyrir staðbundna greiningarverkefnin mín. Til dæmis gerir það þér kleift að finna fjarlægðina milli tveggja póstnúmera og veitir landfræðilegar upplýsingar með því að taka land og póstnúmer sem inntak.
!pip setja upp síðukóða
Fáðu landfræðilegar upplýsingar fyrir tiltekin póstnúmer
# Leitar eftir landi "Indland" nomi = pgeocode.Nominatim('In') # Fá landfræðilegar upplýsingar með því að senda póstnúmerin nomi.query_postal_code(["620018", "620017", "620012"])
„Pgeocode“ reiknar fjarlægðina milli tveggja póstnúmera með því að taka landið og póstnúmerin sem inntak. Niðurstaðan er gefin upp í kílómetrum.
# Finndu fjarlægð milli tveggja póstnúmera fjarlægð = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg er annað gagnlegt bókasafn sem fjarlægir bakgrunninn auðveldlega af myndum.
!pip install rembg
# Flytja inn bókasöfn
frá rembg import fjarlægja import cv2 # slóð inntaksmyndar (skráin mín: image.jpeg) input_path = 'image.jpeg' # slóð til að vista úttaksmynd og vista sem output.jpeg output_path = 'output.jpeg' # Að lesa inntakið myndinntak = cv2.imread(input_path) # Fjarlægir bakgrunnsúttak = fjarlægja(inntak) # Vistar skrá cv2.imwrite(output_path, output)
Þú gætir nú þegar kannast við sum af þessum bókasöfnum, en fyrir mig eru Sketch, Pendulum, pgeocode og ftfy ómissandi fyrir gagnaverkfræðivinnuna mína. Ég treysti mikið á þá fyrir verkefnin mín.
Humanize“ veitir einfalt, auðvelt að lesa strengjasnið fyrir tölur, dagsetningar og tíma. Markmið safnsins er að taka gögnin og gera þau notendavænni, til dæmis með því að breyta nokkrum sekúndum í læsilegri streng eins og „2 minutes ago“. Safnið getur sniðið gögn á ýmsan hátt, þar á meðal að forsníða tölur með kommum, umbreyta tímastimplum í hlutfallslega tíma og fleira.
Ég nota oft heiltölur og tímastimpla fyrir gagnaverkfræðiverkefnin mín.
!pip install manngerð
# Flytja inn bókasafnsinnflutning manngerð innflutnings dagsetningu tíma sem dt # Formatting númera með kommu a = humanize.intcomma(951009) # umbreytir tölum í orð b = humanize.intword(10046328394) #printing print(a) print(b)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
Síðasta mánudag tilkynnti Financial Times um samning við OpenAI. FT leyfir heimsklassa blaðamennsku…
Milljónir manna borga fyrir streymisþjónustu og greiða mánaðarlega áskriftargjöld. Það er almenn skoðun að þú…
Coveware frá Veeam mun halda áfram að veita viðbragðsþjónustu fyrir tölvukúgun. Coveware mun bjóða upp á réttar- og úrbótamöguleika ...
Forspárviðhald er að gjörbylta olíu- og gasgeiranum, með nýstárlegri og fyrirbyggjandi nálgun við verksmiðjustjórnun.…