مقالات

حيرت انگيز، پر ٿورڙي ڄاتل پٿون لائبريريون

Python پروگرامر هميشه نئين لائبريرين جي ڳولا ۾ آهي، جيڪي ڊيٽا انجنيئرنگ ۽ ڪاروباري انٽيليجنس منصوبن ۾ ڪم کي بهتر بڻائي سگهن ٿيون.

هن آرٽيڪل ۾ اسان ڏسون ٿا ڪجھ ٿورڙي سڃاتل، پر تمام مفيد پٿون لائبريريون:

1. پينڊولم

جيتوڻيڪ ڪيتريون ئي لائبريريون موجود آهن Python DateTime لاءِ، مون کي لڳي ٿو Pendulum ڪنهن به تاريخ جي آپريشن تي استعمال ڪرڻ آسان آهي. ڪم تي منهنجي روزاني استعمال لاءِ هڪ پينڊولم منهنجو پسنديده ڪتابي ڪيس آهي. بلٽ ان پٿون ڊيٽ ٽائيم ماڊل کي وڌايو، ٽائم زونز کي منظم ڪرڻ ۽ تاريخ ۽ وقت جي عملن کي انجام ڏيڻ لاءِ وڌيڪ وجداني API شامل ڪري ٿو جيئن وقت جي وقفن کي شامل ڪرڻ، تاريخن کي گھٽائڻ، ۽ وقت جي زونن جي وچ ۾ تبديل ڪرڻ. تاريخن ۽ وقتن کي فارميٽ ڪرڻ لاءِ هڪ سادي ۽ وجداني API مهيا ڪري ٿي.

انسٽاٽيوزيو
!pip install pendulum
مثال
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
پيداوار

2. ftfy

ڇا توهان محسوس ڪيو آهي جڏهن ڊيٽا ۾ غير ملڪي ٻولي صحيح طور تي ظاهر نه ٿيندي آهي؟ اهو Mojibake سڏيو ويندو آهي. Mojibake ھڪڙو اصطلاح آھي جنھن کي بيان ڪرڻ لاء استعمال ڪيو ويندو آھي ڳاڙھي يا ڇڪيل ٽيڪسٽ جيڪو انڪوڊنگ يا ڊيڪوڊنگ جي مسئلن جي نتيجي ۾ ٿئي ٿو. اهو عام طور تي تڏهن ٿيندو آهي جڏهن هڪ اکرن جي انڪوڊنگ سان لکيل متن کي مختلف انڪوڊنگ استعمال ڪندي غلط طور تي ڊيڪوڊ ڪيو ويندو آهي. ftfy python لائبريري توهان جي مدد ڪندي Mojibake کي درست ڪرڻ ۾، جيڪا NLP استعمال جي ڪيسن ۾ تمام مفيد آهي.

انسٽاٽيوزيو
پائپ انسٽال ڪريو ftfy
مثال
پرنٽ(ftfy.fix_text('Ftfyâ€\x9d استعمال ڪندي جملي کي درست ڪريو')) پرنٽ (ftfy.fix_text('âœ" متن سان ڪو مسئلو ناهي')) پرنٽ (ftfy.fix_text('à perturber la réflexion) '))
پيداوار

Mojibake کان علاوه، ftfy خراب انڪوڊنگ، خراب لائن ختم ٿيڻ، ۽ خراب حوالن کي درست ڪندو. متن کي سمجھي سگھي ٿو جيڪو ھيٺ ڏنل انڪوڊنگن مان ھڪڙي طور ڊيڪوڊ ڪيو ويو آھي:

  • لاطيني-1 (ISO-8859-1)
  • Windows-1252 (cp1252 — Microsoft مصنوعات ۾ استعمال ٿيل)
  • Windows-1251 (cp1251 — cp1252 جو روسي نسخو)
  • Windows-1250 (cp1250 — cp1252 جو مشرقي يورپي ورزن)
  • ISO-8859-2 (جيڪو ونڊوز-1250 وانگر بلڪل نه آهي)
  • MacRoman (استعمال ٿيل Mac OS 9 ۽ اڳوڻي تي)
  • cp437 (MS-DOS ۾ استعمال ٿيل ۽ ونڊوز ڪمانڊ پرامپٽ جا ڪجھ ورجن)

3 اسڪيٽ

اسڪيچ هڪ منفرد AI ڪوڊنگ اسسٽنٽ آهي جيڪو خاص طور تي استعمال ڪندڙن لاءِ ٺهيل آهي جيڪي پيٿون ۾ پانڊاس لائبريري سان ڪم ڪري رهيا آهن. اهو صارف جي ڊيٽا جي حوالي سان سمجھڻ لاءِ مشين لرننگ الگورتھم استعمال ڪري ٿو ۽ ڊيٽا جي استعمال ۽ تجزيو جي ڪمن کي آسان ۽ وڌيڪ ڪارائتو بڻائڻ لاءِ لاڳاپيل ڪوڊ تجويزون مهيا ڪري ٿو. اسڪيچ جي ضرورت ناهي ته صارفين کي انهن جي IDE ۾ ڪنهن به اضافي پلگ ان کي انسٽال ڪرڻ لاء، ان کي جلدي ۽ استعمال ڪرڻ آسان بڻائي ٿي. اهو خاص طور تي ڊيٽا سان لاڳاپيل ڪمن لاءِ گهربل وقت ۽ ڪوشش کي گهٽائي سگهي ٿو ۽ صارفين کي بهتر، وڌيڪ موثر ڪوڊ لکڻ ۾ مدد ڪري سگهي ٿو.

انسٽاٽيوزيو
!pip انسٽال اسڪيچ
مثال

هن لائبريري کي استعمال ڪرڻ لاءِ اسان کي پانڊاس ڊيٽا فريم ۾ .sketch ايڪسٽينشن شامل ڪرڻ جي ضرورت آهي.

خاڪو. پڇڻ

پڇيو اسڪيچ جي هڪ خاصيت آهي جيڪا صارفين کي انهن جي ڊيٽا بابت سوال پڇڻ جي اجازت ڏئي ٿي قدرتي ٻولي جي شڪل ۾. صارف جي سوال تي متن جي بنياد تي جواب ڏئي ٿو.

# امپورٽنگ لائبرريون امپورٽ اسڪيچ امپورٽ پانڊاس پي ڊي طور # ڊيٽا پڙهڻ (مثال طور Twitter ڊيٽا استعمال ڪندي) df = pd.read_csv("tweets.csv") print(df)
# پڇڻ ته ڪھڙا ڪالم ڪيٽيگري جا قسم آھن df.sketch.ask("ڪهڙا ڪالم ڪيٽيگري جا قسم آھن؟")
پيداوار
# ڊيٽا فريم جي شڪل ڳولڻ لاءِ df.sketch.ask ("ڊيٽا فريم جي شڪل ڇا آهي")

.sketch.ڪيئن

ڪيئن هڪ خاصيت آهي جيڪا ڪوڊ جو هڪ بلاڪ مهيا ڪري ٿي جيڪا مختلف ڊيٽا سان لاڳاپيل سرگرمين لاءِ شروعاتي نقطي يا نتيجي طور استعمال ٿي سگهي ٿي. اسان انهن جي ڊيٽا کي عام ڪرڻ لاءِ ڪوڊ جا ٽڪرا طلب ڪري سگهون ٿا، نيون خاصيتون ٺاهيون، ڊيٽا کي ٽريڪ ڪريو، ۽ ماڊل پڻ ٺاهيو. اهو وقت بچائيندو ۽ ڪوڊ کي ڪاپي ۽ پيسٽ ڪرڻ آسان بڻائيندو؛ توهان کي شروع کان دستي طور ڪوڊ لکڻ جي ضرورت ناهي.

# جذبات کي ڏسڻ لاءِ snipped ڪوڊ مهيا ڪرڻ لاءِ پڇڻ df.sketch.howto("جذبات کي ڏسو")
پيداوار

.sketch.apply

.apply فنڪشن اهو مدد ڪري ٿو نيون خاصيتون پيدا ڪرڻ، فيلڊ کي پارس ڪرڻ، ۽ ٻين ڊيٽا جي ڦيرڦار کي انجام ڏيڻ. ھن خصوصيت کي استعمال ڪرڻ لاءِ، اسان کي ھڪڙو OpenAI اڪائونٽ ھئڻ گھرجي ۽ ڪمن کي انجام ڏيڻ لاءِ API ڪيئي استعمال ڪرڻ گھرجي. مون هن خصوصيت جي ڪوشش نه ڪئي آهي.

مون هن لائبريري کي استعمال ڪندي لطف اندوز ڪيو، خاص طور تي اچ اهو ڪم ڪري ٿو، ۽ مون کي اهو مفيد ملندو.

4. پيجڪوڊ

”pgeocode“ هڪ بهترين لائبريري آهي جنهن تي مون تازو ئي ٿڪايو آهي جيڪو منهنجي مقامي تجزياتي منصوبن لاءِ ناقابل يقين حد تائين مفيد آهي. مثال طور، اهو توهان کي ٻن پوسٽل ڪوڊ جي وچ ۾ فاصلو ڳولڻ جي اجازت ڏئي ٿو ۽ هڪ ملڪ ۽ پوسٽل ڪوڊ ان پٽ جي طور تي جغرافيائي معلومات مهيا ڪري ٿو.

انسٽاٽيوزيو
!pip انسٽال pgeocode
مثال

مخصوص پوسٽ ڪوڊ لاءِ جاگرافيائي معلومات حاصل ڪريو

# ملڪ لاءِ چيڪ ڪري رهيو آهي "هندستان" nomi = pgeocode.Nominatim('In') # پوسٽ ڪوڊس پاس ڪندي جيو ڄاڻ حاصل ڪرڻ nomi.query_postal_code(["620018", "620017", "620012"])
پيداوار

"pgeocode" ٻن پوسٽ ڪوڊ جي وچ ۾ فاصلي کي ملڪ ۽ پوسٽ ڪوڊس کي ان پٽ طور وٺي ٿو. نتيجو ڪلوميٽرن ۾ بيان ڪيو ويو آهي.

# ٻن پوسٽ ڪوڊ جي وچ ۾ فاصلو ڳولڻ = pgeocode.GeoDistance('In') दूरी.query_postal_code("620018", "620012")
پيداوار

5. rembg

rembg هڪ ٻي مفيد لائبريري آهي جيڪا آساني سان تصويرن مان پس منظر کي هٽائي ٿي.

انسٽاٽيوزيو
!pip انسٽال rembg
مثال
# درآمد لائبريريون
from rembg import remove import cv2 # path of input image (my file: image.jpeg) input_path = 'image.jpeg' # آئوٽ پٽ تصوير کي محفوظ ڪرڻ لاءِ رستو ۽ output.jpeg output_path = 'output.jpeg' # ان پٽ پڙهڻ تصوير ان پٽ = cv2.imread(input_path) # پس منظر ڪڍڻ = هٽايو (انپٽ) # فائل محفوظ ڪرڻ cv2.imwrite(output_path، output)
پيداوار

توهان شايد انهن مان ڪجهه لائبريرين کان واقف هوندا، پر منهنجي لاءِ، اسڪيچ، پينڊولم، پيجڪوڊ، ۽ ايف ٽي ايف آءِ منهنجي ڊيٽا انجنيئرنگ ڪم لاءِ ناگزير آهن. آئون انهن تي گهڻو ڀروسو ڪريان ٿو منهنجي منصوبن لاءِ.

6. انسانيت ڪرڻ

Humanize" انگن، تاريخن ۽ وقتن لاءِ سادي، پڙهڻ ۾ آسان اسٽرنگ فارميٽنگ مهيا ڪري ٿي. لائبريري جو مقصد ڊيٽا کي کڻڻ ۽ ان کي وڌيڪ استعمال ڪندڙ-دوست بڻائڻ آهي، مثال طور ڪيترن ئي سيڪنڊن کي وڌيڪ پڙهڻ جي قابل اسٽرنگ ۾ تبديل ڪرڻ جهڙوڪ "2 منٽ اڳ". لائبريري مختلف طريقن سان ڊيٽا کي فارميٽ ڪري سگهي ٿي، بشمول ڪاما سان نمبر فارميٽ ڪرڻ، ٽائم اسٽيمپ کي لاڳاپيل وقتن ۾ تبديل ڪرڻ، ۽ وڌيڪ.

مان اڪثر پنهنجي ڊيٽا انجنيئرنگ منصوبن لاءِ انٽيجرز ۽ ٽائم اسٽيمپ استعمال ڪندو آهيان.

انسٽاٽيوزيو
!pip انسٽال humanize
مثال (Integers)
# Importing Library Import humanize import datetime as dt # ڪاما سان نمبر فارميٽ ڪرڻ a = humanize.intcomma(951009) # انگن کي لفظن ۾ تبديل ڪرڻ b = humanize.intword(10046328394) #printing print(a) print(b)
پيداوار
مثال (تاريخ ۽ وقت)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

جدت نيوز ليٽر
جدت تي سڀ کان اهم خبر نه وڃايو. انهن کي اي ميل ذريعي حاصل ڪرڻ لاء سائن اپ ڪريو.
ٽيگ: سٿان

تازيون مضمونون

ٻارن لاءِ رنگين صفحن جا فائدا - سڀني عمرن لاءِ جادوءَ جي دنيا

رنگ سازي ذريعي سٺي موٽر صلاحيتن کي ترقي ڪرڻ ٻارن کي وڌيڪ پيچيده صلاحيتن لاء تيار ڪري ٿو جهڙوڪ لکڻ. رنگ ڏيڻ…

2 2024

مستقبل هتي آهي: ڪيئن شپنگ انڊسٽري عالمي معيشت ۾ انقلاب آڻيندي آهي

بحري شعبي هڪ حقيقي عالمي معاشي طاقت آهي، جيڪا 150 بلين مارڪيٽ جي طرف نيويگيٽ ڪئي آهي ...

1 2024

پبلشرز ۽ OpenAI مصنوعي ذهانت پاران پروسيس ڪيل معلومات جي وهڪري کي منظم ڪرڻ لاءِ معاهدن تي دستخط ڪن ٿا

گذريل سومر، فنانشل ٽائمز OpenAI سان هڪ ڊيل جو اعلان ڪيو. ايف ٽي پنهنجي عالمي سطح جي صحافت کي لائسنس ڏئي ٿو ...

30 اپريل 2024

آن لائين ادائگيون: ھتي آھي ڪيئن اسٽريمنگ سروسز توھان کي ھميشه لاءِ ادا ڪنديون آھن

لکين ماڻهو ادا ڪن ٿا اسٽريمنگ سروسز لاءِ، ادا ڪندا مھينا سبسڪرپشن فيس. اها عام راءِ آهي ته توهان…

29 اپريل 2024

پنھنجي ٻوليءَ ۾ جدت پڙھو

جدت نيوز ليٽر
جدت تي سڀ کان اهم خبر نه وڃايو. انهن کي اي ميل ذريعي حاصل ڪرڻ لاء سائن اپ ڪريو.

اسان جي تابعداري ڪريو