Հոդվածներ

Զարմանալի, բայց քիչ հայտնի Python գրադարաններ

Python-ի ծրագրավորողը միշտ փնտրում է նոր գրադարաններ, որոնք կարող են բարելավել աշխատանքը տվյալների ճարտարագիտության և բիզնես հետախուզության նախագծերում:

Այս հոդվածում մենք տեսնում ենք մի քանի քիչ հայտնի, բայց շատ օգտակար python գրադարաններ.

Բովանդակության ինդեքս

1. Pոճանակ

Չնայած նրան, որ շատ գրադարաններ կան այստեղ Python DateTime-ի համար ես գտնում եմ, որ ճոճանակը հեշտ է օգտագործել ցանկացած ամսաթվի գործողության ժամանակ: Ճոճանակն իմ ամենասիրած գրապահարանն է, որն իմ ամենօրյա օգտագործումն է աշխատավայրում: Ընդլայնում է ներկառուցված Python datetime մոդուլը՝ ավելացնելով ավելի ինտուիտիվ API՝ ժամային գոտիները կառավարելու և ամսաթվի և ժամի գործողություններ կատարելու համար, ինչպիսիք են ժամանակային ընդմիջումներ ավելացնելը, ամսաթվերը հանելը և ժամային գոտիների միջև փոխակերպումը: Ապահովում է պարզ և ինտուիտիվ API՝ ամսաթվերի և ժամերի ձևաչափման համար:

Տեղադրեք

!pip install pendulum

օրինակ

# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)

Արտադրողականություն

2. ftfy

Հանդիպե՞լ եք, երբ տվյալների մեջ օտար լեզուն ճիշտ չի երևում։ Սա կոչվում է Mojibake: Mojibake-ը տերմին է, որն օգտագործվում է նկարագրելու աղավաղված կամ խճճված տեքստը, որն առաջանում է կոդավորման կամ վերծանման խնդիրների հետևանքով: Սովորաբար դա տեղի է ունենում, երբ մեկ նիշի կոդավորմամբ գրված տեքստը սխալ է վերծանվում՝ օգտագործելով այլ կոդավորում: ftfy python գրադարանը կօգնի ձեզ շտկել Mojibake-ը, որը շատ օգտակար է NLP-ի օգտագործման դեպքերում։

Տեղադրեք

!pip install ftfy

օրինակ

print(ftfy.fix_text('Ուղղիր նախադասությունը՝ օգտագործելով â€œftfyâ€\x9d')) print(ftfy.fix_text('âœ” Տեքստի հետ խնդիրներ չկան')) print(ftfy.fix_text('Ã perturber la rÃ©flexion '))

Արտադրողականություն

Բացի Mojibake-ից, ftfy-ն կշտկի վատ կոդավորումները, վատ տողերի վերջավորությունները և վատ մեջբերումները: կարող է հասկանալ տեքստը, որը վերծանվել է որպես հետևյալ կոդավորումներից մեկը.

Լատինական-1 (ISO-8859–1)
Windows-1252 (cp1252 — օգտագործվում է Microsoft-ի արտադրանքներում)
Windows-1251 (cp1251 — cp1252-ի ռուսերեն տարբերակը)
Windows-1250 (cp1250 — cp1252-ի արևելաեվրոպական տարբերակը)
ISO-8859–2 (որը բոլորովին նույնը չէ Windows-1250-ին)
MacRoman (օգտագործվում է Mac OS 9-ում և ավելի վաղ)
cp437 (օգտագործվում է MS-DOS-ում և Windows հրամանի տողի որոշ տարբերակներում)

3 Ուրվագիծ

Sketch-ը եզակի AI կոդավորման օգնական է, որը նախատեսված է հատուկ Python-ում պանդաների գրադարանի հետ աշխատող օգտատերերի համար: Այն օգտագործում է մեքենայական ուսուցման ալգորիթմներ՝ հասկանալու օգտատերերի տվյալների համատեքստը և տրամադրում է համապատասխան կոդերի առաջարկներ՝ տվյալների մանիպուլյացիայի և վերլուծության առաջադրանքները ավելի հեշտ և արդյունավետ դարձնելու համար: Sketch-ը չի պահանջում օգտատերերից իրենց IDE-ում տեղադրել լրացուցիչ հավելումներ՝ դարձնելով այն արագ և հեշտ օգտագործման համար: Սա կարող է զգալիորեն նվազեցնել տվյալների հետ կապված առաջադրանքների համար պահանջվող ժամանակը և ջանքերը և օգնել օգտվողներին գրել ավելի լավ, ավելի արդյունավետ կոդ:

Տեղադրեք

!pip install sketch

օրինակ

Այս գրադարանն օգտագործելու համար մենք պետք է ավելացնենք .sketch ընդլայնում pandas dataframe-ում:

.ուրվագիծ.հարցրեք

խնդրել Sketch-ի առանձնահատկությունն է, որը թույլ է տալիս օգտատերերին հարցեր տալ իրենց տվյալների վերաբերյալ բնական լեզվով: Տրամադրում է տեքստի վրա հիմնված պատասխան օգտվողի հարցմանը:

# Ներմուծող գրադարաններ ներմուծում են էսքիզ ներմուծվող պանդաները որպես pd # Տվյալների ընթերցում (օգտագործելով twitter-ի տվյալները որպես օրինակ) df = pd.read_csv("tweets.csv") print(df)

# Հարցնում, թե որ սյունակներն են կատեգորիայի տիպը df.sketch.ask («Ո՞ր սյունակներն են կատեգորիայի տեսակը»):

Արտադրողականություն

# Տվյալների շրջանակի ձևը գտնելու համար df.sketch.ask («Ինչ է տվյալների շրջանակի ձևը»)

.ուրվագիծ.ինչպես

Ինչպես հատկություն է, որն ապահովում է կոդի բլոկ, որը կարող է օգտագործվել որպես ելակետ կամ վերջնակետ տվյալների հետ կապված տարբեր առաջադրանքների համար: Մենք կարող ենք խնդրել կոդի հատվածներ՝ իրենց տվյալները նորմալացնելու, նոր հնարավորություններ ստեղծելու, տվյալների հետևելու և նույնիսկ մոդելներ ստեղծելու համար: Սա կխնայի ժամանակը և կհեշտացնի ծածկագրի պատճենումը և տեղադրումը. պետք չէ կոդը ձեռքով զրոյից գրել:

# Խնդրում ենք տրամադրել կտրված կոդը՝ զգացմունքները պատկերացնելու համար df.sketch.howto («Պատկերացրեք զգացմունքները»)

Արտադրողականություն

.ուրվագիծ.դիմել

Դիմել ֆունկցիան այն օգնում է ստեղծել նոր հնարավորություններ, վերլուծել դաշտերը և կատարել տվյալների այլ մանիպուլյացիաներ: Այս հնարավորությունն օգտագործելու համար մենք պետք է ունենանք OpenAI հաշիվ և օգտագործենք API ստեղնը՝ առաջադրանքները կատարելու համար: Ես չեմ փորձել այս գործառույթը:

Ինձ դուր եկավ հատկապես այս գրադարանից օգտվելը Գալ այն աշխատում է, և ես գտնում եմ, որ այն օգտակար է:

4. pgeocode

«pgeocode»-ը հիանալի գրադարան է, որը ես վերջերս պատահաբար հանդիպեցի, որը աներևակայելի օգտակար էր իմ տարածական վերլուծության նախագծերի համար: Օրինակ, այն թույլ է տալիս գտնել երկու փոստային ինդեքսների միջև հեռավորությունը և տրամադրում է աշխարհագրական տեղեկատվություն՝ որպես մուտքագրում երկիր և փոստային ինդեքս:

Տեղադրեք

!pip տեղադրել pgeocode

օրինակ

Ստացեք աշխարհագրական տեղեկատվություն կոնկրետ փոստային ինդեքսների համար

# Ստուգում է երկրի «Հնդկաստան» nomi = pgeocode.Nominatim('In') # Ստացեք աշխարհագրական տեղեկատվություն՝ փոխանցելով փոստային կոդերը nomi.query_postal_code(["620018", "620017", "620012"])

Արտադրողականություն

«pgeocode»-ը հաշվարկում է երկու փոստային ինդեքսների միջև եղած հեռավորությունը՝ որպես մուտքագրում ընդունելով երկիրը և փոստային ինդեքսները: Արդյունքն արտահայտվում է կիլոմետրերով։

# Գտնել հեռավորություն երկու փոստային կոդերի միջև հեռավորություն = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")

Արտադրողականություն

5. rembg

rembg-ը ևս մեկ օգտակար գրադարան է, որը հեշտությամբ հեռացնում է ֆոնը պատկերներից:

Տեղադրեք

!pip install rembg

օրինակ

# Գրադարանների ներմուծում

rembg ներմուծումից հեռացնել ներմուծումը cv2 # մուտքագրման պատկերի ուղին (իմ ֆայլը՝ image.jpeg) input_path = 'image.jpeg' # ուղի ելքային պատկերը պահելու և որպես output.jpeg output_path = 'output.jpeg' # Մուտքի ընթերցում պատկերի մուտքագրում = cv2.imread(մուտքագրման_ուղի) # Հեռացնելով ֆոնային ելքը = հեռացնել(մուտքագրում) # Ֆայլի պահպանում cv2.imwrite(ելքի_ուղի, ելք)

Արտադրողականություն

Հնարավոր է, որ դուք արդեն ծանոթ եք այս գրադարաններից մի քանիսին, բայց ինձ համար Sketch, Pendulum, pgeocode և ftfy-ն անփոխարինելի են իմ տվյալների ինժեներական աշխատանքի համար: Իմ նախագծերում ես շատ եմ ապավինում նրանց:

6. Մարդկայնացնել

Humanize»–ն ապահովում է թվերի, ամսաթվերի և ժամերի պարզ, հեշտ ընթեռնելի տողերի ձևաչափում։ Գրադարանի նպատակն է վերցնել տվյալները և դրանք ավելի հարմար դարձնել օգտատերերի համար, օրինակ՝ մի քանի վայրկյան վերածելով ավելի ընթեռնելի տողի, ինչպիսին է «2 րոպե առաջ»: Գրադարանը կարող է ֆորմատավորել տվյալները տարբեր ձևերով, այդ թվում՝ թվերի ձևաչափումը ստորակետերով, ժամանակի դրոշմանիշները հարաբերական ժամանակների փոխակերպում և այլն:

Ես հաճախ օգտագործում եմ ամբողջ թվեր և ժամանակի դրոշմներ իմ տվյալների ինժեներական նախագծերի համար:

Տեղադրեք

!pip install humanize

Օրինակ (ամբողջ թվեր)

# Ներմուծող գրադարանի ներմուծում մարդկայնացնել ներմուծման ամսաթիվը որպես dt # Թվերի ձևաչափում ստորակետով a = humanize.intcomma(951009) # թվերի վերածում բառերի b = humanize.intword(10046328394) #printing print(a) print(b)

Արտադրողականություն

Օրինակ (ամսաթիվ և ժամ)

ներմուծել հումանիզացնել ներմուծման ամսաթիվը ժամը որպես dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

Tags: Python

Հունիսի 7, 2023, 5:14

հաջորդ Spot by NetApp հարցումը ընդգծում է CloudOps-ի կարևորությունը ձեռնարկության մակարդակում և բացահայտում այն հիմնական մարտահրավերները, որոնք ամպային թիմերը պետք է լուծեն հաջողության հասնելու համար »

Նախկինում « MicroStrategy-ն ընդլայնում է համագործակցությունը Microsoft-ի հետ՝ խթանելու AI-ի վրա հիմնված վերլուծությունների զարգացումը

Վերջին հոդվածները

Comunicati Stampa

Veeam-ն ունի ամենաընդգրկուն աջակցություն փրկագինին՝ պաշտպանությունից մինչև պատասխան և վերականգնում

Veeam-ի Coveware-ը կշարունակի տրամադրել կիբեր շորթման միջադեպերի արձագանքման ծառայություններ: Coveware-ը կառաջարկի դատաբժշկական և վերականգնման հնարավորություններ…

23 Ապրիլ 2024

Հոդվածներ

Կանաչ և թվային հեղափոխություն. Ինչպես է կանխատեսելի սպասարկումը փոխակերպում նավթի և գազի արդյունաբերությունը

Կանխատեսելի սպասարկումը հեղափոխություն է անում նավթի և գազի ոլորտում՝ կայանի կառավարման նորարարական և ակտիվ մոտեցմամբ:…

22 Ապրիլ 2024

Հոդվածներ

Մեծ Բրիտանիայի հակամենաշնորհային կարգավորիչը բարձրացնում է BigTech-ի ահազանգը GenAI-ի վերաբերյալ

Մեծ Բրիտանիայի CMA-ն նախազգուշացում է տարածել արհեստական ինտելեկտի շուկայում Big Tech-ի վարքագծի վերաբերյալ: Այնտեղ…

18 Ապրիլ 2024

Comunicati Stampa

Casa Green. էներգետիկ հեղափոխություն կայուն ապագայի համար Իտալիայում

Շենքերի էներգաարդյունավետության բարձրացման նպատակով Եվրոպական միության կողմից ձևակերպված «Քեյս Գրին» հրամանագիրը իր օրենսդրական գործընթացն ավարտել է…

18 Ապրիլ 2024

Զարմանալի, բայց քիչ հայտնի Python գրադարաններ

Python-ի ծրագրավորողը միշտ փնտրում է նոր գրադարաններ, որոնք կարող են բարելավել աշխատանքը տվյալների ճարտարագիտության և բիզնես հետախուզության նախագծերում:

1. Pոճանակ

Տեղադրեք

օրինակ

Արտադրողականություն

2. ftfy

Տեղադրեք

օրինակ

Արտադրողականություն

3 Ուրվագիծ

Տեղադրեք

օրինակ

.ուրվագիծ.հարցրեք

Արտադրողականություն

Արտադրողականություն

4. pgeocode

Տեղադրեք

օրինակ

Արտադրողականություն

Արտադրողականություն

5. rembg

Տեղադրեք

օրինակ

Արտադրողականություն

6. Մարդկայնացնել

Տեղադրեք

Օրինակ (ամբողջ թվեր)

Արտադրողականություն

Օրինակ (ամսաթիվ և ժամ)

Վերջին հոդվածները

Veeam-ն ունի ամենաընդգրկուն աջակցություն փրկագինին՝ պաշտպանությունից մինչև պատասխան և վերականգնում

Կանաչ և թվային հեղափոխություն. Ինչպես է կանխատեսելի սպասարկումը փոխակերպում նավթի և գազի արդյունաբերությունը

Մեծ Բրիտանիայի հակամենաշնորհային կարգավորիչը բարձրացնում է BigTech-ի ահազանգը GenAI-ի վերաբերյալ

Casa Green. էներգետիկ հեղափոխություն կայուն ապագայի համար Իտալիայում

Վերջին հոդվածները

Տվյալների տեսակը որոշող հայտանիշ