Այս հոդվածում մենք տեսնում ենք մի քանի քիչ հայտնի, բայց շատ օգտակար python գրադարաններ.
Չնայած նրան, որ շատ գրադարաններ կան այստեղ Python DateTime-ի համար ես գտնում եմ, որ ճոճանակը հեշտ է օգտագործել ցանկացած ամսաթվի գործողության ժամանակ: Ճոճանակն իմ ամենասիրած գրապահարանն է, որն իմ ամենօրյա օգտագործումն է աշխատավայրում: Ընդլայնում է ներկառուցված Python datetime մոդուլը՝ ավելացնելով ավելի ինտուիտիվ API՝ ժամային գոտիները կառավարելու և ամսաթվի և ժամի գործողություններ կատարելու համար, ինչպիսիք են ժամանակային ընդմիջումներ ավելացնելը, ամսաթվերը հանելը և ժամային գոտիների միջև փոխակերպումը: Ապահովում է պարզ և ինտուիտիվ API՝ ամսաթվերի և ժամերի ձևաչափման համար:
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Հանդիպե՞լ եք, երբ տվյալների մեջ օտար լեզուն ճիշտ չի երևում։ Սա կոչվում է Mojibake: Mojibake-ը տերմին է, որն օգտագործվում է նկարագրելու աղավաղված կամ խճճված տեքստը, որն առաջանում է կոդավորման կամ վերծանման խնդիրների հետևանքով: Սովորաբար դա տեղի է ունենում, երբ մեկ նիշի կոդավորմամբ գրված տեքստը սխալ է վերծանվում՝ օգտագործելով այլ կոդավորում: ftfy python գրադարանը կօգնի ձեզ շտկել Mojibake-ը, որը շատ օգտակար է NLP-ի օգտագործման դեպքերում։
!pip install ftfy
print(ftfy.fix_text('Ուղղիր նախադասությունը՝ օգտագործելով “ftfyâ€\x9d')) print(ftfy.fix_text('✔ Տեքստի հետ խնդիրներ չկան')) print(ftfy.fix_text('à perturber la réflexion '))
Բացի Mojibake-ից, ftfy-ն կշտկի վատ կոդավորումները, վատ տողերի վերջավորությունները և վատ մեջբերումները: կարող է հասկանալ տեքստը, որը վերծանվել է որպես հետևյալ կոդավորումներից մեկը.
Sketch-ը եզակի AI կոդավորման օգնական է, որը նախատեսված է հատուկ Python-ում պանդաների գրադարանի հետ աշխատող օգտատերերի համար: Այն օգտագործում է մեքենայական ուսուցման ալգորիթմներ՝ հասկանալու օգտատերերի տվյալների համատեքստը և տրամադրում է համապատասխան կոդերի առաջարկներ՝ տվյալների մանիպուլյացիայի և վերլուծության առաջադրանքները ավելի հեշտ և արդյունավետ դարձնելու համար: Sketch-ը չի պահանջում օգտատերերից իրենց IDE-ում տեղադրել լրացուցիչ հավելումներ՝ դարձնելով այն արագ և հեշտ օգտագործման համար: Սա կարող է զգալիորեն նվազեցնել տվյալների հետ կապված առաջադրանքների համար պահանջվող ժամանակը և ջանքերը և օգնել օգտվողներին գրել ավելի լավ, ավելի արդյունավետ կոդ:
!pip install sketch
Այս գրադարանն օգտագործելու համար մենք պետք է ավելացնենք .sketch ընդլայնում pandas dataframe-ում:
խնդրել Sketch-ի առանձնահատկությունն է, որը թույլ է տալիս օգտատերերին հարցեր տալ իրենց տվյալների վերաբերյալ բնական լեզվով: Տրամադրում է տեքստի վրա հիմնված պատասխան օգտվողի հարցմանը:
# Ներմուծող գրադարաններ ներմուծում են էսքիզ ներմուծվող պանդաները որպես pd # Տվյալների ընթերցում (օգտագործելով twitter-ի տվյալները որպես օրինակ) df = pd.read_csv("tweets.csv") print(df)
# Հարցնում, թե որ սյունակներն են կատեգորիայի տիպը df.sketch.ask («Ո՞ր սյունակներն են կատեգորիայի տեսակը»):
# Տվյալների շրջանակի ձևը գտնելու համար df.sketch.ask («Ինչ է տվյալների շրջանակի ձևը»)
.ուրվագիծ.ինչպես
Ինչպես հատկություն է, որն ապահովում է կոդի բլոկ, որը կարող է օգտագործվել որպես ելակետ կամ վերջնակետ տվյալների հետ կապված տարբեր առաջադրանքների համար: Մենք կարող ենք խնդրել կոդի հատվածներ՝ իրենց տվյալները նորմալացնելու, նոր հնարավորություններ ստեղծելու, տվյալների հետևելու և նույնիսկ մոդելներ ստեղծելու համար: Սա կխնայի ժամանակը և կհեշտացնի ծածկագրի պատճենումը և տեղադրումը. պետք չէ կոդը ձեռքով զրոյից գրել:
# Խնդրում ենք տրամադրել կտրված կոդը՝ զգացմունքները պատկերացնելու համար df.sketch.howto («Պատկերացրեք զգացմունքները»)
.ուրվագիծ.դիմել
Դիմել ֆունկցիան այն օգնում է ստեղծել նոր հնարավորություններ, վերլուծել դաշտերը և կատարել տվյալների այլ մանիպուլյացիաներ: Այս հնարավորությունն օգտագործելու համար մենք պետք է ունենանք OpenAI հաշիվ և օգտագործենք API ստեղնը՝ առաջադրանքները կատարելու համար: Ես չեմ փորձել այս գործառույթը:
Ինձ դուր եկավ հատկապես այս գրադարանից օգտվելը Գալ այն աշխատում է, և ես գտնում եմ, որ այն օգտակար է:
«pgeocode»-ը հիանալի գրադարան է, որը ես վերջերս պատահաբար հանդիպեցի, որը աներևակայելի օգտակար էր իմ տարածական վերլուծության նախագծերի համար: Օրինակ, այն թույլ է տալիս գտնել երկու փոստային ինդեքսների միջև հեռավորությունը և տրամադրում է աշխարհագրական տեղեկատվություն՝ որպես մուտքագրում երկիր և փոստային ինդեքս:
!pip տեղադրել pgeocode
Ստացեք աշխարհագրական տեղեկատվություն կոնկրետ փոստային ինդեքսների համար
# Ստուգում է երկրի «Հնդկաստան» nomi = pgeocode.Nominatim('In') # Ստացեք աշխարհագրական տեղեկատվություն՝ փոխանցելով փոստային կոդերը nomi.query_postal_code(["620018", "620017", "620012"])
«pgeocode»-ը հաշվարկում է երկու փոստային ինդեքսների միջև եղած հեռավորությունը՝ որպես մուտքագրում ընդունելով երկիրը և փոստային ինդեքսները: Արդյունքն արտահայտվում է կիլոմետրերով։
# Գտնել հեռավորություն երկու փոստային կոդերի միջև հեռավորություն = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg-ը ևս մեկ օգտակար գրադարան է, որը հեշտությամբ հեռացնում է ֆոնը պատկերներից:
!pip install rembg
# Գրադարանների ներմուծում
rembg ներմուծումից հեռացնել ներմուծումը cv2 # մուտքագրման պատկերի ուղին (իմ ֆայլը՝ image.jpeg) input_path = 'image.jpeg' # ուղի ելքային պատկերը պահելու և որպես output.jpeg output_path = 'output.jpeg' # Մուտքի ընթերցում պատկերի մուտքագրում = cv2.imread(մուտքագրման_ուղի) # Հեռացնելով ֆոնային ելքը = հեռացնել(մուտքագրում) # Ֆայլի պահպանում cv2.imwrite(ելքի_ուղի, ելք)
Հնարավոր է, որ դուք արդեն ծանոթ եք այս գրադարաններից մի քանիսին, բայց ինձ համար Sketch, Pendulum, pgeocode և ftfy-ն անփոխարինելի են իմ տվյալների ինժեներական աշխատանքի համար: Իմ նախագծերում ես շատ եմ ապավինում նրանց:
Humanize»–ն ապահովում է թվերի, ամսաթվերի և ժամերի պարզ, հեշտ ընթեռնելի տողերի ձևաչափում։ Գրադարանի նպատակն է վերցնել տվյալները և դրանք ավելի հարմար դարձնել օգտատերերի համար, օրինակ՝ մի քանի վայրկյան վերածելով ավելի ընթեռնելի տողի, ինչպիսին է «2 րոպե առաջ»: Գրադարանը կարող է ֆորմատավորել տվյալները տարբեր ձևերով, այդ թվում՝ թվերի ձևաչափումը ստորակետերով, ժամանակի դրոշմանիշները հարաբերական ժամանակների փոխակերպում և այլն:
Ես հաճախ օգտագործում եմ ամբողջ թվեր և ժամանակի դրոշմներ իմ տվյալների ինժեներական նախագծերի համար:
!pip install humanize
# Ներմուծող գրադարանի ներմուծում մարդկայնացնել ներմուծման ամսաթիվը որպես dt # Թվերի ձևաչափում ստորակետով a = humanize.intcomma(951009) # թվերի վերածում բառերի b = humanize.intword(10046328394) #printing print(a) print(b)
ներմուծել հումանիզացնել ներմուծման ամսաթիվը ժամը որպես dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
Veeam-ի Coveware-ը կշարունակի տրամադրել կիբեր շորթման միջադեպերի արձագանքման ծառայություններ: Coveware-ը կառաջարկի դատաբժշկական և վերականգնման հնարավորություններ…
Կանխատեսելի սպասարկումը հեղափոխություն է անում նավթի և գազի ոլորտում՝ կայանի կառավարման նորարարական և ակտիվ մոտեցմամբ:…
Մեծ Բրիտանիայի CMA-ն նախազգուշացում է տարածել արհեստական ինտելեկտի շուկայում Big Tech-ի վարքագծի վերաբերյալ: Այնտեղ…
Շենքերի էներգաարդյունավետության բարձրացման նպատակով Եվրոպական միության կողմից ձևակերպված «Քեյս Գրին» հրամանագիրը իր օրենսդրական գործընթացն ավարտել է…