بیشتر

په زړه پوري، مګر لږ پیژندل شوي پیتون کتابتونونه

د پایتون پروګرامر تل د نوي کتابتونونو په لټه کې وي، کوم چې کولی شي د ډیټا انجینرۍ او سوداګرۍ استخباراتي پروژو کې کار ته وده ورکړي.

پدې مقاله کې موږ یو څه لږ پیژندل شوي ، مګر خورا ګټور پیتون کتابتونونه ګورو:

1. پنډولم

که څه هم ډیری کتابتونونه شتون لري Python د نیټې وخت لپاره، زه پینډولم د هرې نیټې عملیاتو کې کارول اسانه وموم. پنډولم زما په کار کې د ورځني کارونې لپاره زما د خوښې کتابچه ده. د Python د نیټې وخت موډل غزوي، د وخت زونونو اداره کولو او د نیټې او وخت عملیاتو ترسره کولو لپاره یو ډیر دقیق API اضافه کوي لکه د وخت وقفې اضافه کول، د نیټې کمول، او د وخت زونونو ترمنځ بدلول. د نیټې او وختونو فارمیټ کولو لپاره ساده او رواني API چمتو کوي.

انسټالازون
!pip install pendulum
د مثال په
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Output

2. ftfy

ایا تاسو ورسره مخ شوي یاست کله چې په ډاټا کې بهرنۍ ژبه په سمه توګه نه ښکاري؟ دې ته مجیبیک ویل کیږي. موجیبیک یوه اصطلاح ده چې د خراب شوي یا خراب شوي متن تشریح کولو لپاره کارول کیږي چې د کوډ کولو یا کوډ کولو ستونزو په پایله کې پیښیږي. دا معمولا واقع کیږي کله چې د یو حرف کوډ کولو سره لیکل شوی متن د مختلف کوډ کولو په کارولو سره په غلط ډول ډیکوډ شوی وي. د ftfy python کتابتون به تاسو سره د Mojibake په حل کولو کې مرسته وکړي، کوم چې د NLP کارولو قضیو کې خورا ګټور دی.

انسټالازون
pip ftfy نصب کړئ
د مثال په
چاپ (ftfy.fix_text('د “ftfyâ€\x9d په کارولو سره جمله سمه کړئ.')) چاپ (ftfy.fix_text('âœ" په متن کې کومه ستونزه نشته)) چاپ (ftfy.fix_text('à perturber la réflexion) '))
Output

د موجیبیک سربیره، ftfy به خراب کوډونه، د خراب لیک پای، او خراب نرخونه حل کړي. کیدای شي په متن پوه شي چې د لاندې کوډونو څخه د یوې په توګه کوډ شوی دی:

  • لاتین-1 (ISO-8859-1)
  • Windows-1252 (cp1252 - د مایکروسافټ محصولاتو کې کارول کیږي)
  • Windows-1251 (cp1251 — د cp1252 روسي نسخه)
  • وینډوز-1250 (cp1250 - د cp1252 ختیځ اروپا نسخه)
  • ISO-8859-2 (کوم چې د وینډوز-1250 سره ورته نه دی)
  • MacRoman (په Mac OS 9 او پخوانیو کې کارول شوی)
  • cp437 (په MS-DOS کې کارول کیږي او د وینډوز کمانډ پرامپټ ځینې نسخې)

3 سکیچ

سکیچ یو ځانګړی AI کوډینګ معاون دی چې په ځانګړي توګه د هغو کاروونکو لپاره ډیزاین شوی چې په Python کې د پانډاس کتابتون سره کار کوي. دا د کارونکي ډیټا شرایطو پوهیدو لپاره د ماشین زده کړې الګوریتمونه کاروي او اړونده کوډ وړاندیزونه چمتو کوي ترڅو د معلوماتو مینځپانګې او تحلیلي کارونه اسانه او اغیزمن کړي. سکیچ کاروونکو ته اړتیا نلري چې په خپل IDE کې کوم اضافي پلگ ان نصب کړي، دا ګړندي او کارول اسانه کوي. دا کولی شي د ډیټا پورې اړوند دندو لپاره اړین وخت او هڅې د پام وړ کم کړي او کاروونکو سره د غوره، ډیر اغیزمن کوډ لیکلو کې مرسته وکړي.

انسټالازون
!pip د نصب سکیچ
د مثال په

موږ اړتیا لرو چې د دې کتابتون کارولو لپاره د پانډاس ډیټا فریم ته د سکیچ توسیع اضافه کړو.

.sketch.پوښتنه

پوښتنه د سکیچ یوه ځانګړتیا ده چې کاروونکو ته اجازه ورکوي چې د طبیعي ژبې په بڼه کې د دوی د معلوماتو په اړه پوښتنې وکړي. د کارونکي پوښتنې ته د متن پر بنسټ ځواب چمتو کوي.

# د کتابتونونو واردول د سکیچ وارد پانډا د pd په توګه واردوي # د معلوماتو لوستل (د مثال په توګه د ټویټر ډیټا کارول) df = pd.read_csv("tweets.csv") چاپ (df)
# پوښتنه کول چې کوم کالمونه د کټګورۍ ډول دي df.sketch.ask("کوم کالمونه د کټګورۍ ډول دي؟")
Output
# د ډیټا فریم شکل موندلو لپاره df.sketch.ask ("د ډیټا فریم شکل څه دی")

.sketch.howto

څنګه یوه ځانګړتیا ده چې د کوډ بلاک چمتو کوي چې د مختلف معلوماتو پورې اړوند دندو لپاره د پیل یا پای ټکي په توګه کارول کیدی شي. موږ کولی شو د کوډ ټوټو غوښتنه وکړو ترڅو د دوی ډیټا نورمال کړي، نوي ځانګړتیاوې رامینځته کړي، ډاټا تعقیب کړي، او حتی ماډلونه جوړ کړي. دا به وخت خوندي کړي او د کوډ کاپي او پیسټ کول به اسانه کړي؛ تاسو اړتیا نلرئ چې کوډ په لاسي ډول له سکریچ څخه ولیکئ.

# د احساساتو لیدو لپاره د کوډ د چمتو کولو غوښتنه کول df.sketch.howto("د احساساتو لید")
Output

.sketch.apply

د .apply فعالیت دا د نوي ب featuresو په رامینځته کولو کې مرسته کوي ، ساحې پارس کوي ، او د معلوماتو نور لاسوهنې ترسره کوي. د دې خصوصیت کارولو لپاره، موږ باید د OpenAI حساب ولرو او د دندو ترسره کولو لپاره د API کلید وکاروو. ما د دې ځانګړتیا هڅه نه ده کړې.

ما د دې کتابتون کارولو څخه خوند واخیست، په ځانګړې توګه راځي دا کار کوي، او زه یې ګټور وموم.

4. pgeocode

"pgeocode" یو عالي کتابتون دی چې ما پدې وروستیو کې ټکان خوړلی چې زما د ځایي تحلیلي پروژو لپاره خورا په زړه پوري ګټور و. د مثال په توګه، دا تاسو ته اجازه درکوي چې د دوو پوستي کوډونو تر مینځ فاصله ومومئ او د هیواد او پوستي کوډ د ننوتلو په واسطه جغرافیایي معلومات چمتو کړئ.

انسټالازون
pip install pgeocode
د مثال په

د ځانګړو پوسټ کوډونو لپاره جغرافيائی معلومات ترلاسه کړئ

# د هیواد "هند" نومي = pgeocode.Nominatim('In') لپاره چک کول # د پوسټ کوډونو په تیریدو سره د جیو معلوماتو ترلاسه کول nomi.query_postal_code(["620018", "620017", "620012"])
Output

"pgeocode" د هیواد او پوسټ کوډونو د ننوتلو په واسطه د دوه پوسټ کوډونو ترمینځ فاصله محاسبه کوي. پایله په کیلومترو کې ښودل شوې.

# د دوه پوستکوډونو ترمنځ فاصله موندل فاصله = pgeocode.GeoDistance('In') فاصله.query_postal_code("620018", "620012")
Output

5. rembg

rembg یو بل ګټور کتابتون دی چې په اسانۍ سره د عکسونو شالید لرې کوي.

انسټالازون
pip install rembg
د مثال په
# د کتابتونونو واردول
from rembg import remove import cv2 # د ننوت عکس لاره (زما فایل: image.jpeg) input_path = 'image.jpeg' # لاره د آوټ پټ عکس خوندي کولو او د output.jpeg په توګه خوندي کول output_path = 'output.jpeg' # د ننوت لوستل د انځور داخلول = cv2.imread(input_path) # د شاليد محصول لرې کول = لرې کول (ان پټ) # د فایل خوندي کول cv2.imwrite(output_path, output)
Output

تاسو ممکن دمخه د دې ځینې کتابتونونو سره آشنا یاست ، مګر زما لپاره ، سکیچ ، پینډولم ، پیجیو کوډ ، او ftfy زما د ډیټا انجینرۍ کار لپاره لازمي دي. زه د خپلو پروژو لپاره په دوی ډیر تکیه کوم.

6. انسان کول

Humanize" د شمیرو، نیټو، او وختونو لپاره ساده، د لوستلو لپاره اسانه سټرینګ بڼه چمتو کوي. د کتابتون هدف دا دی چې ډاټا واخلي او دا د کاروونکي دوستانه کړي، د بیلګې په توګه د یو شمیر ثانیو بدلول د لوستلو وړ تار ته لکه "2 دقیقې مخکې". کتابتون کولی شي ډاټا په مختلفو لارو فارمیټ کړي، پشمول د کوما سره د شمیرو فارمیټ کول، د وخت سټیمپونو په نسبي وختونو کې بدلول، او نور.

زه ډیری وختونه زما د ډیټا انجینرۍ پروژو لپاره انټیجرونه او ټایم سټیمپونه کاروم.

انسټالازون
د پایپ نصب کول humanize
بېلګه
# د کتابتون واردول humanize import datetime د dt په توګه # د کوما سره د شمیرو فارمیټ کول a = humanize.intcomma(951009) # په کلمو کې د شمیرو بدلول b = humanize.intword(10046328394) #printing print(a) print(b)
Output
بېلګه (نیټه او وخت)
د واردولو انساني کول د وارداتو نیټه وخت dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

د نوښت خبر پاڼه
د نوښت په اړه خورا مهم خبرونه له لاسه مه ورکوئ. د بریښنالیک له لارې دوی ترلاسه کولو لپاره لاسلیک وکړئ.
توري: پيډون

وروستي مقالې

خپرونکي او OpenAI تړونونه لاسلیک کوي ترڅو د مصنوعي استخباراتو لخوا پروسس شوي معلوماتو جریان تنظیم کړي

تیره دوشنبه، فایننشل ټایمز د OpenAI سره یوه معامله اعلان کړه. FT د نړۍ په کچه ژورنالیزم جواز ورکوي ...

30 اپریل 2024

آنلاین تادیات: دلته د سټیمینګ خدمات تاسو ته د تل لپاره تادیه کوي

ملیونونه خلک د سټیمینګ خدماتو لپاره تادیه کوي ، د میاشتنۍ ګډون فیس ورکوي. دا عام نظر دی چې تاسو…

29 اپریل 2024

Veeam د ransomware لپاره خورا پراخه ملاتړ وړاندې کوي ، له محافظت څخه تر غبرګون او رغیدو پورې

د Veeam لخوا Coveware به د سایبر غصب پیښو غبرګون خدماتو چمتو کولو ته دوام ورکړي. Coveware به د عدلي او درملنې وړتیاوې وړاندې کړي ...

23 اپریل 2024

شنه او ډیجیټل انقلاب: د وړاندوینې وړ ساتنه څنګه د تیلو او ګاز صنعت بدلوي

د وړاندوینې ساتنه د تیلو او ګاز سکتور کې انقلاب رامینځته کوي ، د نبات مدیریت لپاره د نوښت او فعال چلند سره.

22 اپریل 2024

نوښت په خپله ژبه ولولئ

د نوښت خبر پاڼه
د نوښت په اړه خورا مهم خبرونه له لاسه مه ورکوئ. د بریښنالیک له لارې دوی ترلاسه کولو لپاره لاسلیک وکړئ.

مونږ سره په