এই নিবন্ধে আমরা কিছু স্বল্প পরিচিত, কিন্তু খুব দরকারী পাইথন লাইব্রেরি দেখতে পাচ্ছি:
যদিও অনেক লাইব্রেরিতে পাওয়া যায় পাইথন DateTime এর জন্য, আমি পেন্ডুলাম যেকোন তারিখ অপারেশনে ব্যবহার করা সহজ বলে মনে করি। কর্মক্ষেত্রে আমার দৈনন্দিন ব্যবহারের জন্য একটি পেন্ডুলাম আমার প্রিয় বইয়ের আলমারি। বিল্ট-ইন পাইথন ডেটটাইম মডিউলটি প্রসারিত করে, সময় অঞ্চল পরিচালনার জন্য একটি আরও স্বজ্ঞাত API যোগ করে এবং তারিখ এবং সময় ক্রিয়াকলাপগুলি যেমন সময়ের ব্যবধান যোগ করা, তারিখ বিয়োগ করা এবং সময় অঞ্চলগুলির মধ্যে রূপান্তর করা। তারিখ এবং সময় বিন্যাস করার জন্য একটি সহজ এবং স্বজ্ঞাত API প্রদান করে।
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
ডেটাতে বিদেশী ভাষা সঠিকভাবে প্রদর্শিত না হলে আপনি কি সম্মুখীন হয়েছেন? একে বলে মজিবকে। Mojibake হল এমন একটি শব্দ যা এনকোডিং বা ডিকোডিং সমস্যার ফলে ঘটতে থাকা বিকৃত বা স্ক্র্যাম্বল করা টেক্সটকে বর্ণনা করতে ব্যবহৃত হয়। এটি সাধারণত ঘটে যখন একটি অক্ষর এনকোডিং সহ লেখা পাঠ্য একটি ভিন্ন এনকোডিং ব্যবহার করে ভুলভাবে ডিকোড করা হয়। ftfy পাইথন লাইব্রেরি আপনাকে Mojibake ঠিক করতে সাহায্য করবে, যা NLP ব্যবহারের ক্ষেত্রে খুবই উপযোগী।
পিপ ইনস্টল ftfy
print(ftfy.fix_text('ftfyâ€\x9d ব্যবহার করে বাক্যটি সংশোধন করুন।')) print(ftfy.fix_text('✔ পাঠ্যের সাথে কোন সমস্যা নেই')) প্রিন্ট(ftfy.fix_text('à perturber la réflexion) '))
Mojibake ছাড়াও, ftfy খারাপ এনকোডিং, খারাপ লাইন শেষ এবং খারাপ উদ্ধৃতি ঠিক করবে। নিম্নলিখিত এনকোডিংগুলির মধ্যে একটি হিসাবে ডিকোড করা পাঠ্য বুঝতে পারে:
স্কেচ হল একটি অনন্য এআই কোডিং সহকারী যা পাইথনে পান্ডাস লাইব্রেরির সাথে কাজ করা ব্যবহারকারীদের জন্য বিশেষভাবে ডিজাইন করা হয়েছে। এটি ব্যবহারকারীর ডেটার প্রেক্ষাপট বোঝার জন্য মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে এবং ডেটা ম্যানিপুলেশন এবং বিশ্লেষণের কাজগুলিকে সহজ এবং আরও দক্ষ করার জন্য প্রাসঙ্গিক কোড পরামর্শ প্রদান করে। স্কেচ ব্যবহারকারীদের তাদের IDE-তে কোনো অতিরিক্ত প্লাগ-ইন ইনস্টল করার প্রয়োজন হয় না, এটি দ্রুত এবং সহজে ব্যবহার করা যায়। এটি ডেটা-সম্পর্কিত কাজের জন্য প্রয়োজনীয় সময় এবং প্রচেষ্টাকে উল্লেখযোগ্যভাবে হ্রাস করতে পারে এবং ব্যবহারকারীদের আরও ভাল, আরও দক্ষ কোড লিখতে সহায়তা করে।
!পিপ ইনস্টল স্কেচ
এই লাইব্রেরিটি ব্যবহার করার জন্য আমাদের পান্ডাস ডেটাফ্রেমে একটি .sketch এক্সটেনশন যোগ করতে হবে।
জিজ্ঞাসা করা স্কেচের একটি বৈশিষ্ট্য যা ব্যবহারকারীদের একটি প্রাকৃতিক ভাষা বিন্যাসে তাদের ডেটা সম্পর্কে প্রশ্ন জিজ্ঞাসা করতে দেয়। ব্যবহারকারীর প্রশ্নের একটি পাঠ্য-ভিত্তিক প্রতিক্রিয়া প্রদান করে।
# ইম্পোর্টিং লাইব্রেরিগুলি পিডি হিসাবে স্কেচ ইম্পোর্ট পান্ডা আমদানি করে # ডেটা পড়া (উদাহরণ হিসাবে টুইটার ডেটা ব্যবহার করে) df = pd.read_csv("tweets.csv") প্রিন্ট(df)
# জিজ্ঞাসা করা যে কোন কলামগুলি বিভাগ প্রকারের df.sketch.ask("কোন কলামগুলি বিভাগ প্রকার?")
# ডেটাফ্রেমের আকৃতি খুঁজতে df.sketch.ask ("ডাটাফ্রেমের আকৃতি কী")
.sketch.howto
কিভাবে একটি বৈশিষ্ট্য যা কোডের একটি ব্লক প্রদান করে যা বিভিন্ন ডেটা-সম্পর্কিত কাজের জন্য শুরু বা শেষ বিন্দু হিসাবে ব্যবহার করা যেতে পারে। আমরা তাদের ডেটা স্বাভাবিক করতে, নতুন বৈশিষ্ট্য তৈরি করতে, ডেটা ট্র্যাক করতে এবং এমনকি মডেল তৈরি করতে কোডের স্নিপেট চাইতে পারি। এটি সময় বাঁচাবে এবং কোড কপি এবং পেস্ট করা সহজ করবে; আপনাকে স্ক্র্যাচ থেকে ম্যানুয়ালি কোড লিখতে হবে না।
# আবেগগুলি কল্পনা করার জন্য স্নিপ করা কোড প্রদান করতে বলা df.sketch.howto("আবেগগুলিকে কল্পনা করুন")
.sketch.apply
.apply ফাংশন এটি নতুন বৈশিষ্ট্য তৈরি করতে, ক্ষেত্রগুলি পার্স করতে এবং অন্যান্য ডেটা ম্যানিপুলেশন করতে সহায়তা করে। এই বৈশিষ্ট্যটি ব্যবহার করার জন্য, আমাদের একটি OpenAI অ্যাকাউন্ট থাকতে হবে এবং কাজগুলি সম্পাদন করতে API কী ব্যবহার করতে হবে। আমি এই বৈশিষ্ট্য চেষ্টা করেনি.
আমি বিশেষ করে এই লাইব্রেরি ব্যবহার করে উপভোগ করেছি আসা এটা কাজ করে, এবং আমি এটা দরকারী খুঁজে.
"pgeocode" একটি চমৎকার লাইব্রেরি যা আমি সম্প্রতি হোঁচট খেয়েছি যেটি আমার স্থানিক বিশ্লেষণ প্রকল্পগুলির জন্য অবিশ্বাস্যভাবে কার্যকর হয়েছে। উদাহরণস্বরূপ, এটি আপনাকে দুটি পোস্টাল কোডের মধ্যে দূরত্ব খুঁজে পেতে দেয় এবং একটি দেশ এবং পোস্টাল কোড ইনপুট হিসাবে গ্রহণ করে ভৌগলিক তথ্য প্রদান করে।
!pip pgeocode ইনস্টল করুন
নির্দিষ্ট পোস্টকোডের জন্য ভৌগলিক তথ্য পান
# দেশের জন্য পরীক্ষা করা হচ্ছে "India" nomi = pgeocode.Nominatim('In') # পোস্টকোড nomi.query_postal_code(["620018", "620017", "620012"]) পাস করে জিও তথ্য পাওয়া
"pgeocode" ইনপুট হিসাবে দেশ এবং পোস্টকোড গ্রহণ করে দুটি পোস্টকোডের মধ্যে দূরত্ব গণনা করে৷ ফলাফল কিলোমিটারে প্রকাশ করা হয়।
# দুটি পোস্টকোডের মধ্যে দূরত্ব খোঁজা দূরত্ব = pgeocode.GeoDistance('In') দূরত্ব.query_postal_code("620018", "620012")
rembg হল আরেকটি দরকারী লাইব্রেরি যা সহজেই ছবি থেকে ব্যাকগ্রাউন্ড সরিয়ে দেয়।
পিপ ইনস্টল rembg
# লাইব্রেরি আমদানি করা হচ্ছে
থেকে rembg import remove import cv2 # ইনপুট ইমেজের পাথ (আমার ফাইল: image.jpeg) input_path = 'image.jpeg' # আউটপুট ইমেজ সেভ করার জন্য এবং output.jpeg output_path = 'output.jpeg' # ইনপুট পড়া ইমেজ ইনপুট = cv2.imread(input_path) # ব্যাকগ্রাউন্ড আউটপুট অপসারণ = রিমুভ(ইনপুট) # ফাইল সংরক্ষণ করা হচ্ছে cv2.imwrite(output_path, output)
আপনি হয়তো ইতিমধ্যেই এই লাইব্রেরির কিছুর সাথে পরিচিত, কিন্তু আমার জন্য, স্কেচ, পেন্ডুলাম, pgeocode, এবং ftfy আমার ডেটা ইঞ্জিনিয়ারিং কাজের জন্য অপরিহার্য। আমি আমার প্রকল্পগুলির জন্য তাদের উপর অনেক নির্ভর করি।
হিউম্যানাইজ” সংখ্যা, তারিখ এবং সময়ের জন্য সহজ, সহজে পঠনযোগ্য স্ট্রিং বিন্যাস প্রদান করে। লাইব্রেরির লক্ষ্য হল ডেটা গ্রহণ করা এবং এটিকে আরও ব্যবহারকারী-বান্ধব করা, উদাহরণস্বরূপ কয়েক সেকেন্ডকে "2 মিনিট আগে" এর মতো আরও পাঠযোগ্য স্ট্রিংয়ে রূপান্তর করা। লাইব্রেরি বিভিন্ন উপায়ে ডেটা ফর্ম্যাট করতে পারে, যার মধ্যে কমা দিয়ে নম্বর ফর্ম্যাটিং, টাইমস্ট্যাম্পগুলিকে আপেক্ষিক সময়ে রূপান্তর করা এবং আরও অনেক কিছু।
আমি প্রায়ই আমার ডেটা ইঞ্জিনিয়ারিং প্রকল্পগুলির জন্য পূর্ণসংখ্যা এবং টাইমস্ট্যাম্প ব্যবহার করি।
পিপ ইন্সটল হিউম্যানাইজ
# ইমপোর্ট করা লাইব্রেরি ইম্পোর্ট মানবাইজ ইম্পোর্ট ডেটটাইম dt হিসাবে # কমা দিয়ে নম্বর ফরম্যাটিং a = humanize.intcomma(951009) # নম্বরগুলিকে শব্দে রূপান্তর করা হচ্ছে b = humanize.intword(10046328394) #printing print(a) print(b)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
অ্যাপল ভিশন প্রো কমার্শিয়াল ভিউয়ার ব্যবহার করে ক্যাটানিয়া পলিক্লিনিকে একটি চক্ষুরোগ অপারেশন করা হয়েছিল...
রঙের মাধ্যমে সূক্ষ্ম মোটর দক্ষতার বিকাশ শিশুদের লেখার মতো জটিল দক্ষতার জন্য প্রস্তুত করে। রঙ…
নৌ সেক্টর একটি সত্যিকারের বৈশ্বিক অর্থনৈতিক শক্তি, যা 150 বিলিয়ন বাজারের দিকে নেভিগেট করেছে...
গত সোমবার, ফাইন্যান্সিয়াল টাইমস ওপেনএআই-এর সাথে একটি চুক্তি ঘোষণা করেছে। FT তার বিশ্বমানের সাংবাদিকতার লাইসেন্স দেয়...