প্রবন্ধ

আশ্চর্যজনক, কিন্তু স্বল্প পরিচিত পাইথন লাইব্রেরি

পাইথন প্রোগ্রামার সবসময় নতুন লাইব্রেরি খোঁজে, যা ডেটা ইঞ্জিনিয়ারিং এবং ব্যবসায়িক বুদ্ধিমত্তা প্রকল্পে কাজ উন্নত করতে পারে।

এই নিবন্ধে আমরা কিছু স্বল্প পরিচিত, কিন্তু খুব দরকারী পাইথন লাইব্রেরি দেখতে পাচ্ছি:

1. পেন্ডুলাম

যদিও অনেক লাইব্রেরিতে পাওয়া যায় পাইথন DateTime এর জন্য, আমি পেন্ডুলাম যেকোন তারিখ অপারেশনে ব্যবহার করা সহজ বলে মনে করি। কর্মক্ষেত্রে আমার দৈনন্দিন ব্যবহারের জন্য একটি পেন্ডুলাম আমার প্রিয় বইয়ের আলমারি। বিল্ট-ইন পাইথন ডেটটাইম মডিউলটি প্রসারিত করে, সময় অঞ্চল পরিচালনার জন্য একটি আরও স্বজ্ঞাত API যোগ করে এবং তারিখ এবং সময় ক্রিয়াকলাপগুলি যেমন সময়ের ব্যবধান যোগ করা, তারিখ বিয়োগ করা এবং সময় অঞ্চলগুলির মধ্যে রূপান্তর করা। তারিখ এবং সময় বিন্যাস করার জন্য একটি সহজ এবং স্বজ্ঞাত API প্রদান করে।

ইনস্টলাজিওন
!pip install pendulum
উদাহরণ
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
আউটপুট

2. ftfy

ডেটাতে বিদেশী ভাষা সঠিকভাবে প্রদর্শিত না হলে আপনি কি সম্মুখীন হয়েছেন? একে বলে মজিবকে। Mojibake হল এমন একটি শব্দ যা এনকোডিং বা ডিকোডিং সমস্যার ফলে ঘটতে থাকা বিকৃত বা স্ক্র্যাম্বল করা টেক্সটকে বর্ণনা করতে ব্যবহৃত হয়। এটি সাধারণত ঘটে যখন একটি অক্ষর এনকোডিং সহ লেখা পাঠ্য একটি ভিন্ন এনকোডিং ব্যবহার করে ভুলভাবে ডিকোড করা হয়। ftfy পাইথন লাইব্রেরি আপনাকে Mojibake ঠিক করতে সাহায্য করবে, যা NLP ব্যবহারের ক্ষেত্রে খুবই উপযোগী।

ইনস্টলাজিওন
পিপ ইনস্টল ftfy
উদাহরণ
print(ftfy.fix_text('ftfyâ€\x9d ব্যবহার করে বাক্যটি সংশোধন করুন।')) print(ftfy.fix_text('✔ পাঠ্যের সাথে কোন সমস্যা নেই')) প্রিন্ট(ftfy.fix_text('à perturber la réflexion) '))
আউটপুট

Mojibake ছাড়াও, ftfy খারাপ এনকোডিং, খারাপ লাইন শেষ এবং খারাপ উদ্ধৃতি ঠিক করবে। নিম্নলিখিত এনকোডিংগুলির মধ্যে একটি হিসাবে ডিকোড করা পাঠ্য বুঝতে পারে:

  • ল্যাটিন-1 (ISO-8859–1)
  • Windows-1252 (cp1252 — Microsoft পণ্যে ব্যবহৃত)
  • Windows-1251 (cp1251 — cp1252 এর রাশিয়ান সংস্করণ)
  • Windows-1250 (cp1250 — cp1252 এর পূর্ব ইউরোপীয় সংস্করণ)
  • ISO-8859–2 (যা ঠিক Windows-1250 এর মতো নয়)
  • MacRoman (ম্যাক OS 9 এবং তার আগে ব্যবহৃত)
  • cp437 (MS-DOS এবং Windows কমান্ড প্রম্পটের কিছু সংস্করণে ব্যবহৃত)

3। স্কেচ

স্কেচ হল একটি অনন্য এআই কোডিং সহকারী যা পাইথনে পান্ডাস লাইব্রেরির সাথে কাজ করা ব্যবহারকারীদের জন্য বিশেষভাবে ডিজাইন করা হয়েছে। এটি ব্যবহারকারীর ডেটার প্রেক্ষাপট বোঝার জন্য মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে এবং ডেটা ম্যানিপুলেশন এবং বিশ্লেষণের কাজগুলিকে সহজ এবং আরও দক্ষ করার জন্য প্রাসঙ্গিক কোড পরামর্শ প্রদান করে। স্কেচ ব্যবহারকারীদের তাদের IDE-তে কোনো অতিরিক্ত প্লাগ-ইন ইনস্টল করার প্রয়োজন হয় না, এটি দ্রুত এবং সহজে ব্যবহার করা যায়। এটি ডেটা-সম্পর্কিত কাজের জন্য প্রয়োজনীয় সময় এবং প্রচেষ্টাকে উল্লেখযোগ্যভাবে হ্রাস করতে পারে এবং ব্যবহারকারীদের আরও ভাল, আরও দক্ষ কোড লিখতে সহায়তা করে।

ইনস্টলাজিওন
!পিপ ইনস্টল স্কেচ
উদাহরণ

এই লাইব্রেরিটি ব্যবহার করার জন্য আমাদের পান্ডাস ডেটাফ্রেমে একটি .sketch এক্সটেনশন যোগ করতে হবে।

.sketch.ask

জিজ্ঞাসা করা স্কেচের একটি বৈশিষ্ট্য যা ব্যবহারকারীদের একটি প্রাকৃতিক ভাষা বিন্যাসে তাদের ডেটা সম্পর্কে প্রশ্ন জিজ্ঞাসা করতে দেয়। ব্যবহারকারীর প্রশ্নের একটি পাঠ্য-ভিত্তিক প্রতিক্রিয়া প্রদান করে।

# ইম্পোর্টিং লাইব্রেরিগুলি পিডি হিসাবে স্কেচ ইম্পোর্ট পান্ডা আমদানি করে # ডেটা পড়া (উদাহরণ হিসাবে টুইটার ডেটা ব্যবহার করে) df = pd.read_csv("tweets.csv") প্রিন্ট(df)
# জিজ্ঞাসা করা যে কোন কলামগুলি বিভাগ প্রকারের df.sketch.ask("কোন কলামগুলি বিভাগ প্রকার?")
আউটপুট
# ডেটাফ্রেমের আকৃতি খুঁজতে df.sketch.ask ("ডাটাফ্রেমের আকৃতি কী")

.sketch.howto

কিভাবে একটি বৈশিষ্ট্য যা কোডের একটি ব্লক প্রদান করে যা বিভিন্ন ডেটা-সম্পর্কিত কাজের জন্য শুরু বা শেষ বিন্দু হিসাবে ব্যবহার করা যেতে পারে। আমরা তাদের ডেটা স্বাভাবিক করতে, নতুন বৈশিষ্ট্য তৈরি করতে, ডেটা ট্র্যাক করতে এবং এমনকি মডেল তৈরি করতে কোডের স্নিপেট চাইতে পারি। এটি সময় বাঁচাবে এবং কোড কপি এবং পেস্ট করা সহজ করবে; আপনাকে স্ক্র্যাচ থেকে ম্যানুয়ালি কোড লিখতে হবে না।

# আবেগগুলি কল্পনা করার জন্য স্নিপ করা কোড প্রদান করতে বলা df.sketch.howto("আবেগগুলিকে কল্পনা করুন")
আউটপুট

.sketch.apply

.apply ফাংশন এটি নতুন বৈশিষ্ট্য তৈরি করতে, ক্ষেত্রগুলি পার্স করতে এবং অন্যান্য ডেটা ম্যানিপুলেশন করতে সহায়তা করে। এই বৈশিষ্ট্যটি ব্যবহার করার জন্য, আমাদের একটি OpenAI অ্যাকাউন্ট থাকতে হবে এবং কাজগুলি সম্পাদন করতে API কী ব্যবহার করতে হবে। আমি এই বৈশিষ্ট্য চেষ্টা করেনি.

আমি বিশেষ করে এই লাইব্রেরি ব্যবহার করে উপভোগ করেছি আসা এটা কাজ করে, এবং আমি এটা দরকারী খুঁজে.

4. pgeocode

"pgeocode" একটি চমৎকার লাইব্রেরি যা আমি সম্প্রতি হোঁচট খেয়েছি যেটি আমার স্থানিক বিশ্লেষণ প্রকল্পগুলির জন্য অবিশ্বাস্যভাবে কার্যকর হয়েছে। উদাহরণস্বরূপ, এটি আপনাকে দুটি পোস্টাল কোডের মধ্যে দূরত্ব খুঁজে পেতে দেয় এবং একটি দেশ এবং পোস্টাল কোড ইনপুট হিসাবে গ্রহণ করে ভৌগলিক তথ্য প্রদান করে।

ইনস্টলাজিওন
!pip pgeocode ইনস্টল করুন
উদাহরণ

নির্দিষ্ট পোস্টকোডের জন্য ভৌগলিক তথ্য পান

# দেশের জন্য পরীক্ষা করা হচ্ছে "India" nomi = pgeocode.Nominatim('In') # পোস্টকোড nomi.query_postal_code(["620018", "620017", "620012"]) পাস করে জিও তথ্য পাওয়া
আউটপুট

"pgeocode" ইনপুট হিসাবে দেশ এবং পোস্টকোড গ্রহণ করে দুটি পোস্টকোডের মধ্যে দূরত্ব গণনা করে৷ ফলাফল কিলোমিটারে প্রকাশ করা হয়।

# দুটি পোস্টকোডের মধ্যে দূরত্ব খোঁজা দূরত্ব = pgeocode.GeoDistance('In') দূরত্ব.query_postal_code("620018", "620012")
আউটপুট

5. rembg

rembg হল আরেকটি দরকারী লাইব্রেরি যা সহজেই ছবি থেকে ব্যাকগ্রাউন্ড সরিয়ে দেয়।

ইনস্টলাজিওন
পিপ ইনস্টল rembg
উদাহরণ
# লাইব্রেরি আমদানি করা হচ্ছে
থেকে rembg import remove import cv2 # ইনপুট ইমেজের পাথ (আমার ফাইল: image.jpeg) input_path = 'image.jpeg' # আউটপুট ইমেজ সেভ করার জন্য এবং output.jpeg output_path = 'output.jpeg' # ইনপুট পড়া ইমেজ ইনপুট = cv2.imread(input_path) # ব্যাকগ্রাউন্ড আউটপুট অপসারণ = রিমুভ(ইনপুট) # ফাইল সংরক্ষণ করা হচ্ছে cv2.imwrite(output_path, output)
আউটপুট

আপনি হয়তো ইতিমধ্যেই এই লাইব্রেরির কিছুর সাথে পরিচিত, কিন্তু আমার জন্য, স্কেচ, পেন্ডুলাম, pgeocode, এবং ftfy আমার ডেটা ইঞ্জিনিয়ারিং কাজের জন্য অপরিহার্য। আমি আমার প্রকল্পগুলির জন্য তাদের উপর অনেক নির্ভর করি।

6. মানবীকরণ

হিউম্যানাইজ” সংখ্যা, তারিখ এবং সময়ের জন্য সহজ, সহজে পঠনযোগ্য স্ট্রিং বিন্যাস প্রদান করে। লাইব্রেরির লক্ষ্য হল ডেটা গ্রহণ করা এবং এটিকে আরও ব্যবহারকারী-বান্ধব করা, উদাহরণস্বরূপ কয়েক সেকেন্ডকে "2 মিনিট আগে" এর মতো আরও পাঠযোগ্য স্ট্রিংয়ে রূপান্তর করা। লাইব্রেরি বিভিন্ন উপায়ে ডেটা ফর্ম্যাট করতে পারে, যার মধ্যে কমা দিয়ে নম্বর ফর্ম্যাটিং, টাইমস্ট্যাম্পগুলিকে আপেক্ষিক সময়ে রূপান্তর করা এবং আরও অনেক কিছু।

আমি প্রায়ই আমার ডেটা ইঞ্জিনিয়ারিং প্রকল্পগুলির জন্য পূর্ণসংখ্যা এবং টাইমস্ট্যাম্প ব্যবহার করি।

ইনস্টলাজিওন
পিপ ইন্সটল হিউম্যানাইজ
উদাহরণ (পূর্ণসংখ্যা)
# ইমপোর্ট করা লাইব্রেরি ইম্পোর্ট মানবাইজ ইম্পোর্ট ডেটটাইম dt হিসাবে # কমা দিয়ে নম্বর ফরম্যাটিং a = humanize.intcomma(951009) # নম্বরগুলিকে শব্দে রূপান্তর করা হচ্ছে b = humanize.intword(10046328394) #printing print(a) print(b)
আউটপুট
উদাহরণ (তারিখ এবং সময়)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

উদ্ভাবন নিউজলেটার
উদ্ভাবনের সবচেয়ে গুরুত্বপূর্ণ খবর মিস করবেন না। ইমেল দ্বারা তাদের পেতে সাইন আপ করুন.
ট্যাগ্স: পাইথন

সাম্প্রতিক নিবন্ধ

ক্যাটানিয়া পলিক্লিনিকে অ্যাপল দর্শকের সাথে অগমেন্টেড রিয়েলিটিতে উদ্ভাবনী হস্তক্ষেপ

অ্যাপল ভিশন প্রো কমার্শিয়াল ভিউয়ার ব্যবহার করে ক্যাটানিয়া পলিক্লিনিকে একটি চক্ষুরোগ অপারেশন করা হয়েছিল...

3 মে 2024

শিশুদের জন্য রঙিন পৃষ্ঠাগুলির উপকারিতা - সব বয়সের জন্য একটি জাদু বিশ্ব

রঙের মাধ্যমে সূক্ষ্ম মোটর দক্ষতার বিকাশ শিশুদের লেখার মতো জটিল দক্ষতার জন্য প্রস্তুত করে। রঙ…

2 মে 2024

ভবিষ্যত এখানে: শিপিং শিল্প কীভাবে বৈশ্বিক অর্থনীতিতে বিপ্লব ঘটাচ্ছে

নৌ সেক্টর একটি সত্যিকারের বৈশ্বিক অর্থনৈতিক শক্তি, যা 150 বিলিয়ন বাজারের দিকে নেভিগেট করেছে...

1 মে 2024

প্রকাশকরা এবং OpenAI কৃত্রিম বুদ্ধিমত্তা দ্বারা প্রক্রিয়াকৃত তথ্যের প্রবাহ নিয়ন্ত্রণ করতে চুক্তি স্বাক্ষর করে

গত সোমবার, ফাইন্যান্সিয়াল টাইমস ওপেনএআই-এর সাথে একটি চুক্তি ঘোষণা করেছে। FT তার বিশ্বমানের সাংবাদিকতার লাইসেন্স দেয়...

30 এপ্রিল 2024

আপনার ভাষায় উদ্ভাবন পড়ুন

উদ্ভাবন নিউজলেটার
উদ্ভাবনের সবচেয়ে গুরুত্বপূর্ণ খবর মিস করবেন না। ইমেল দ্বারা তাদের পেতে সাইন আপ করুন.

আমাদের অনুসরণ