लेख

अद्भुत, लेकिन अल्पज्ञात पायथन पुस्तकालय

पायथन प्रोग्रामर हमेशा नए पुस्तकालयों की तलाश में रहता है, जो डेटा इंजीनियरिंग और व्यावसायिक खुफिया परियोजनाओं में काम को बेहतर बना सके।

इस लेख में हम कुछ अल्पज्ञात, लेकिन बहुत उपयोगी अजगर पुस्तकालय देखते हैं:

1. पेंडुलम

हालांकि कई पुस्तकालय उपलब्ध हैं अजगर डेटटाइम के लिए, मुझे पेंडुलम किसी भी तारीख के संचालन पर उपयोग करना आसान लगता है। काम पर मेरे दैनिक उपयोग के लिए एक पेंडुलम मेरी पसंदीदा किताबों की अलमारी है। अंतर्निहित पायथन डेटाटाइम मॉड्यूल को बढ़ाता है, समय क्षेत्रों के प्रबंधन के लिए एक अधिक सहज एपीआई जोड़ता है और समय अंतराल जोड़ने, तिथियों को घटाना और समय क्षेत्रों के बीच परिवर्तित करने जैसे दिनांक और समय संचालन करता है। दिनांक और समय स्वरूपित करने के लिए एक सरल और सहज एपीआई प्रदान करता है।

स्थापित कर रहा है
!pip install pendulum
उदाहरण
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
उत्पादन

2. फुटफी

क्या आपने सामना किया है जब डेटा में विदेशी भाषा सही ढंग से प्रकट नहीं होती है? इसे मोजिबेक कहा जाता है। Mojibake एक ऐसा शब्द है जिसका उपयोग विकृत या तले हुए पाठ का वर्णन करने के लिए किया जाता है जो एन्कोडिंग या डिकोडिंग समस्याओं के परिणामस्वरूप होता है। यह आमतौर पर तब होता है जब एक वर्ण एन्कोडिंग के साथ लिखे गए पाठ को एक अलग एन्कोडिंग का उपयोग करके गलत तरीके से डिकोड किया जाता है। ftfy python लाइब्रेरी आपको Mojibake को ठीक करने में मदद करेगी, जो NLP उपयोग के मामलों में बहुत उपयोगी है।

स्थापित कर रहा है
!पिप ftfy स्थापित करें
उदाहरण
प्रिंट(ftfy.fix_text('“ftfyâ€\x9d.' का उपयोग करके वाक्य को सही करें)) प्रिंट(ftfy.fix_text('âœ" पाठ के साथ कोई समस्या नहीं है')) '))
उत्पादन

Mojibake के अलावा, ftfy खराब एनकोडिंग, खराब लाइन एंडिंग और खराब कोट्स को ठीक करेगा। निम्नलिखित एन्कोडिंग में से एक के रूप में डिकोड किए गए पाठ को समझ सकते हैं:

  • लैटिन-1 (आईएसओ-8859-1)
  • Windows-1252 (cp1252 — Microsoft उत्पादों में प्रयुक्त)
  • Windows-1251 (cp1251 — cp1252 का रूसी संस्करण)
  • Windows-1250 (cp1250 — cp1252 का पूर्वी यूरोपीय संस्करण)
  • ISO-8859–2 (जो बिल्कुल Windows-1250 के समान नहीं है)
  • MacRoman (Mac OS 9 और पहले के संस्करण पर प्रयुक्त)
  • cp437 (MS-DOS और Windows कमांड प्रॉम्प्ट के कुछ संस्करणों में प्रयुक्त)

3. स्केच

स्केच एक अद्वितीय एआई कोडिंग सहायक है जिसे विशेष रूप से पायथन में पांडा लाइब्रेरी के साथ काम करने वाले उपयोगकर्ताओं के लिए डिज़ाइन किया गया है। यह उपयोगकर्ता डेटा के संदर्भ को समझने के लिए मशीन लर्निंग एल्गोरिदम का उपयोग करता है और डेटा हेरफेर और विश्लेषण कार्यों को आसान और अधिक कुशल बनाने के लिए प्रासंगिक कोड सुझाव प्रदान करता है। स्केच को उपयोगकर्ताओं को अपने आईडीई में कोई अतिरिक्त प्लग-इन स्थापित करने की आवश्यकता नहीं है, जिससे यह त्वरित और उपयोग में आसान हो जाता है। यह डेटा-संबंधित कार्यों के लिए आवश्यक समय और प्रयास को काफी कम कर सकता है और उपयोगकर्ताओं को बेहतर, अधिक कुशल कोड लिखने में सहायता करता है।

स्थापित कर रहा है
!पिप इंस्टाल स्केच
उदाहरण

हमें इस लाइब्रेरी का उपयोग करने के लिए पांडा डेटाफ़्रेम में .sketch एक्सटेंशन जोड़ने की आवश्यकता है।

.स्केच.पूछो

पूछना स्केच की एक विशेषता है जो उपयोगकर्ताओं को उनके डेटा के बारे में एक प्राकृतिक भाषा प्रारूप में प्रश्न पूछने की अनुमति देती है। उपयोगकर्ता की क्वेरी के लिए टेक्स्ट-आधारित प्रतिक्रिया प्रदान करता है।

# पुस्तकालयों का आयात स्केच आयात पांडा को पीडी के रूप में # डेटा पढ़ना (उदाहरण के रूप में ट्विटर डेटा का उपयोग करना) df = pd.read_csv ("ट्वीट्स.सीएसवी") प्रिंट (डीएफ)
# यह पूछना कि कौन से कॉलम श्रेणी प्रकार के हैं df.sketch.ask ("कौन से कॉलम श्रेणी प्रकार हैं?")
उत्पादन
# डेटाफ्रेम का आकार खोजने के लिए df.sketch.ask("डेटाफ्रेम का आकार क्या है")

.स्केच.कैसे करें

कैसे एक ऐसी सुविधा है जो कोड का एक ब्लॉक प्रदान करती है जिसका उपयोग विभिन्न डेटा-संबंधित कार्यों के लिए प्रारंभ या समाप्ति बिंदु के रूप में किया जा सकता है। हम उनके डेटा को सामान्य बनाने, नई सुविधाएँ बनाने, डेटा ट्रैक करने और यहाँ तक कि मॉडल बनाने के लिए कोड के स्निपेट्स की माँग कर सकते हैं। इससे समय की बचत होगी और कोड को कॉपी और पेस्ट करना आसान हो जाएगा; आपको स्क्रैच से मैन्युअल रूप से कोड लिखने की आवश्यकता नहीं है।

# भावनाओं को देखने के लिए स्निप्ड कोड प्रदान करने के लिए कहना df.sketch.howto("भावनाओं की कल्पना करें")
उत्पादन

.स्केच.लागू करें

.apply फ़ंक्शन यह नई सुविधाएँ उत्पन्न करने, फ़ील्ड पार्स करने और अन्य डेटा जोड़-तोड़ करने में मदद करता है। इस सुविधा का उपयोग करने के लिए, हमारे पास OpenAI खाता होना चाहिए और कार्यों को करने के लिए API कुंजी का उपयोग करना चाहिए। मैंने इस सुविधा को आजमाया नहीं है।

मुझे इस पुस्तकालय का उपयोग करने में विशेष रूप से मज़ा आया कैसे यह काम करता है, और मुझे यह उपयोगी लगता है।

4. जियोकोड

"pgeocode" एक उत्कृष्ट पुस्तकालय है जिस पर मैंने हाल ही में ठोकर खाई है जो मेरे स्थानिक विश्लेषण परियोजनाओं के लिए अविश्वसनीय रूप से उपयोगी रहा है। उदाहरण के लिए, यह आपको दो डाक कोड के बीच की दूरी का पता लगाने की अनुमति देता है और एक देश और डाक कोड को इनपुट के रूप में लेकर भौगोलिक जानकारी प्रदान करता है।

स्थापित कर रहा है
!पिप pgeocode स्थापित करें
उदाहरण

विशिष्ट पोस्टकोड के लिए भौगोलिक जानकारी प्राप्त करें

# देश "भारत" nomi = pgeocode.Nominatim ('In') के लिए जाँच करना
उत्पादन

"pgeocode" देश और पोस्टकोड को इनपुट के रूप में लेकर दो पोस्टकोड के बीच की दूरी की गणना करता है। परिणाम किलोमीटर में व्यक्त किया गया है।

# दो पोस्टकोड दूरी के बीच की दूरी ढूँढना = pgeocode.GeoDistance ('में') दूरी।
उत्पादन

5. रेम्बग

rembg एक अन्य उपयोगी लाइब्रेरी है जो छवियों से पृष्ठभूमि को आसानी से हटा देती है।

स्थापित कर रहा है
!पिप रेम्बग स्थापित करें
उदाहरण
# पुस्तकालयों का आयात करना
rembg आयात से आयात cv2 हटाएं # इनपुट छवि का पथ (मेरी फ़ाइल: image.jpeg) input_path = 'image.jpeg' # आउटपुट छवि को सहेजने और आउटपुट के रूप में सहेजने के लिए पथ। इमेज इनपुट = cv2.imread (इनपुट_पथ) # बैकग्राउंड आउटपुट हटाना = रिमूव (इनपुट) # सेविंग फाइल cv2.imwrite (आउटपुट_पथ, आउटपुट)
उत्पादन

आप इनमें से कुछ पुस्तकालयों से पहले से ही परिचित हो सकते हैं, लेकिन मेरे डेटा इंजीनियरिंग कार्य के लिए स्केच, पेंडुलम, pgeocode और ftfy अपरिहार्य हैं। मैं अपनी परियोजनाओं के लिए उन पर बहुत भरोसा करता हूं।

6. मानवीकरण करें

मानवीकरण” संख्या, दिनांक और समय के लिए सरल, पढ़ने में आसान स्ट्रिंग स्वरूपण प्रदान करता है। पुस्तकालय का लक्ष्य डेटा लेना और इसे अधिक उपयोगकर्ता के अनुकूल बनाना है, उदाहरण के लिए कुछ सेकंड को "2 मिनट पहले" जैसे अधिक पठनीय स्ट्रिंग में परिवर्तित करना। पुस्तकालय डेटा को विभिन्न तरीकों से प्रारूपित कर सकता है, जिसमें अल्पविरामों के साथ संख्याओं को स्वरूपित करना, टाइमस्टैम्प को सापेक्ष समय में परिवर्तित करना, और बहुत कुछ शामिल है।

मैं अक्सर अपनी डेटा इंजीनियरिंग परियोजनाओं के लिए पूर्णांक और टाइमस्टैम्प का उपयोग करता हूं।

स्थापित कर रहा है
!पिप मानवीयकरण स्थापित करें
उदाहरण (पूर्णांक)
# पुस्तकालय आयात आयात डेटाटाइम को डीटी के रूप में आयात करें # अल्पविराम के साथ संख्याओं का प्रारूपण a = humanize.intcomma(951009) # संख्याओं को शब्दों में परिवर्तित करना b = humanize.intword (10046328394) #प्रिंटिंग प्रिंट (ए) प्रिंट (बी)
उत्पादन
उदाहरण (तारीख और समय)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) प्रिंट(a) प्रिंट(b)

Ercole Palmeri

नवाचार समाचार पत्र
नवाचार पर सबसे महत्वपूर्ण समाचार देखना न भूलें। उन्हें ईमेल द्वारा प्राप्त करने के लिए साइन अप करें।
टैग: अजगर

हाल के लेख

बच्चों के लिए रंग भरने वाले पन्नों के लाभ - सभी उम्र के लोगों के लिए जादू की दुनिया

रंग भरने के माध्यम से बढ़िया मोटर कौशल विकसित करना बच्चों को लेखन जैसे अधिक जटिल कौशल के लिए तैयार करता है। रंग भरना…

2 मई 2024

भविष्य यहाँ है: कैसे शिपिंग उद्योग वैश्विक अर्थव्यवस्था में क्रांति ला रहा है

नौसैनिक क्षेत्र एक सच्ची वैश्विक आर्थिक शक्ति है, जो 150 अरब के बाज़ार की ओर बढ़ चुका है...

1 मई 2024

आर्टिफिशियल इंटेलिजेंस द्वारा संसाधित सूचना के प्रवाह को विनियमित करने के लिए प्रकाशक और ओपनएआई ने समझौते पर हस्ताक्षर किए

पिछले सोमवार को, फाइनेंशियल टाइम्स ने OpenAI के साथ एक समझौते की घोषणा की। एफटी अपनी विश्व स्तरीय पत्रकारिता को लाइसेंस देता है...

अप्रैल 30 2024

ऑनलाइन भुगतान: यहां बताया गया है कि स्ट्रीमिंग सेवाएं आपको हमेशा के लिए भुगतान कैसे कराती हैं

लाखों लोग स्ट्रीमिंग सेवाओं के लिए मासिक सदस्यता शुल्क का भुगतान करते हैं। यह आम राय है कि आप...

अप्रैल 29 2024

अपनी भाषा में इनोवेशन पढ़ें

नवाचार समाचार पत्र
नवाचार पर सबसे महत्वपूर्ण समाचार देखना न भूलें। उन्हें ईमेल द्वारा प्राप्त करने के लिए साइन अप करें।

Seguici