इस लेख में हम कुछ अल्पज्ञात, लेकिन बहुत उपयोगी अजगर पुस्तकालय देखते हैं:
हालांकि कई पुस्तकालय उपलब्ध हैं अजगर डेटटाइम के लिए, मुझे पेंडुलम किसी भी तारीख के संचालन पर उपयोग करना आसान लगता है। काम पर मेरे दैनिक उपयोग के लिए एक पेंडुलम मेरी पसंदीदा किताबों की अलमारी है। अंतर्निहित पायथन डेटाटाइम मॉड्यूल को बढ़ाता है, समय क्षेत्रों के प्रबंधन के लिए एक अधिक सहज एपीआई जोड़ता है और समय अंतराल जोड़ने, तिथियों को घटाना और समय क्षेत्रों के बीच परिवर्तित करने जैसे दिनांक और समय संचालन करता है। दिनांक और समय स्वरूपित करने के लिए एक सरल और सहज एपीआई प्रदान करता है।
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
क्या आपने सामना किया है जब डेटा में विदेशी भाषा सही ढंग से प्रकट नहीं होती है? इसे मोजिबेक कहा जाता है। Mojibake एक ऐसा शब्द है जिसका उपयोग विकृत या तले हुए पाठ का वर्णन करने के लिए किया जाता है जो एन्कोडिंग या डिकोडिंग समस्याओं के परिणामस्वरूप होता है। यह आमतौर पर तब होता है जब एक वर्ण एन्कोडिंग के साथ लिखे गए पाठ को एक अलग एन्कोडिंग का उपयोग करके गलत तरीके से डिकोड किया जाता है। ftfy python लाइब्रेरी आपको Mojibake को ठीक करने में मदद करेगी, जो NLP उपयोग के मामलों में बहुत उपयोगी है।
!पिप ftfy स्थापित करें
प्रिंट(ftfy.fix_text('“ftfyâ€\x9d.' का उपयोग करके वाक्य को सही करें)) प्रिंट(ftfy.fix_text('âœ" पाठ के साथ कोई समस्या नहीं है')) '))
Mojibake के अलावा, ftfy खराब एनकोडिंग, खराब लाइन एंडिंग और खराब कोट्स को ठीक करेगा। निम्नलिखित एन्कोडिंग में से एक के रूप में डिकोड किए गए पाठ को समझ सकते हैं:
स्केच एक अद्वितीय एआई कोडिंग सहायक है जिसे विशेष रूप से पायथन में पांडा लाइब्रेरी के साथ काम करने वाले उपयोगकर्ताओं के लिए डिज़ाइन किया गया है। यह उपयोगकर्ता डेटा के संदर्भ को समझने के लिए मशीन लर्निंग एल्गोरिदम का उपयोग करता है और डेटा हेरफेर और विश्लेषण कार्यों को आसान और अधिक कुशल बनाने के लिए प्रासंगिक कोड सुझाव प्रदान करता है। स्केच को उपयोगकर्ताओं को अपने आईडीई में कोई अतिरिक्त प्लग-इन स्थापित करने की आवश्यकता नहीं है, जिससे यह त्वरित और उपयोग में आसान हो जाता है। यह डेटा-संबंधित कार्यों के लिए आवश्यक समय और प्रयास को काफी कम कर सकता है और उपयोगकर्ताओं को बेहतर, अधिक कुशल कोड लिखने में सहायता करता है।
!पिप इंस्टाल स्केच
हमें इस लाइब्रेरी का उपयोग करने के लिए पांडा डेटाफ़्रेम में .sketch एक्सटेंशन जोड़ने की आवश्यकता है।
पूछना स्केच की एक विशेषता है जो उपयोगकर्ताओं को उनके डेटा के बारे में एक प्राकृतिक भाषा प्रारूप में प्रश्न पूछने की अनुमति देती है। उपयोगकर्ता की क्वेरी के लिए टेक्स्ट-आधारित प्रतिक्रिया प्रदान करता है।
# पुस्तकालयों का आयात स्केच आयात पांडा को पीडी के रूप में # डेटा पढ़ना (उदाहरण के रूप में ट्विटर डेटा का उपयोग करना) df = pd.read_csv ("ट्वीट्स.सीएसवी") प्रिंट (डीएफ)
# यह पूछना कि कौन से कॉलम श्रेणी प्रकार के हैं df.sketch.ask ("कौन से कॉलम श्रेणी प्रकार हैं?")
# डेटाफ्रेम का आकार खोजने के लिए df.sketch.ask("डेटाफ्रेम का आकार क्या है")
.स्केच.कैसे करें
कैसे एक ऐसी सुविधा है जो कोड का एक ब्लॉक प्रदान करती है जिसका उपयोग विभिन्न डेटा-संबंधित कार्यों के लिए प्रारंभ या समाप्ति बिंदु के रूप में किया जा सकता है। हम उनके डेटा को सामान्य बनाने, नई सुविधाएँ बनाने, डेटा ट्रैक करने और यहाँ तक कि मॉडल बनाने के लिए कोड के स्निपेट्स की माँग कर सकते हैं। इससे समय की बचत होगी और कोड को कॉपी और पेस्ट करना आसान हो जाएगा; आपको स्क्रैच से मैन्युअल रूप से कोड लिखने की आवश्यकता नहीं है।
# भावनाओं को देखने के लिए स्निप्ड कोड प्रदान करने के लिए कहना df.sketch.howto("भावनाओं की कल्पना करें")
.स्केच.लागू करें
.apply फ़ंक्शन यह नई सुविधाएँ उत्पन्न करने, फ़ील्ड पार्स करने और अन्य डेटा जोड़-तोड़ करने में मदद करता है। इस सुविधा का उपयोग करने के लिए, हमारे पास OpenAI खाता होना चाहिए और कार्यों को करने के लिए API कुंजी का उपयोग करना चाहिए। मैंने इस सुविधा को आजमाया नहीं है।
मुझे इस पुस्तकालय का उपयोग करने में विशेष रूप से मज़ा आया कैसे यह काम करता है, और मुझे यह उपयोगी लगता है।
"pgeocode" एक उत्कृष्ट पुस्तकालय है जिस पर मैंने हाल ही में ठोकर खाई है जो मेरे स्थानिक विश्लेषण परियोजनाओं के लिए अविश्वसनीय रूप से उपयोगी रहा है। उदाहरण के लिए, यह आपको दो डाक कोड के बीच की दूरी का पता लगाने की अनुमति देता है और एक देश और डाक कोड को इनपुट के रूप में लेकर भौगोलिक जानकारी प्रदान करता है।
!पिप pgeocode स्थापित करें
विशिष्ट पोस्टकोड के लिए भौगोलिक जानकारी प्राप्त करें
# देश "भारत" nomi = pgeocode.Nominatim ('In') के लिए जाँच करना
"pgeocode" देश और पोस्टकोड को इनपुट के रूप में लेकर दो पोस्टकोड के बीच की दूरी की गणना करता है। परिणाम किलोमीटर में व्यक्त किया गया है।
# दो पोस्टकोड दूरी के बीच की दूरी ढूँढना = pgeocode.GeoDistance ('में') दूरी।
rembg एक अन्य उपयोगी लाइब्रेरी है जो छवियों से पृष्ठभूमि को आसानी से हटा देती है।
!पिप रेम्बग स्थापित करें
# पुस्तकालयों का आयात करना
rembg आयात से आयात cv2 हटाएं # इनपुट छवि का पथ (मेरी फ़ाइल: image.jpeg) input_path = 'image.jpeg' # आउटपुट छवि को सहेजने और आउटपुट के रूप में सहेजने के लिए पथ। इमेज इनपुट = cv2.imread (इनपुट_पथ) # बैकग्राउंड आउटपुट हटाना = रिमूव (इनपुट) # सेविंग फाइल cv2.imwrite (आउटपुट_पथ, आउटपुट)
आप इनमें से कुछ पुस्तकालयों से पहले से ही परिचित हो सकते हैं, लेकिन मेरे डेटा इंजीनियरिंग कार्य के लिए स्केच, पेंडुलम, pgeocode और ftfy अपरिहार्य हैं। मैं अपनी परियोजनाओं के लिए उन पर बहुत भरोसा करता हूं।
मानवीकरण” संख्या, दिनांक और समय के लिए सरल, पढ़ने में आसान स्ट्रिंग स्वरूपण प्रदान करता है। पुस्तकालय का लक्ष्य डेटा लेना और इसे अधिक उपयोगकर्ता के अनुकूल बनाना है, उदाहरण के लिए कुछ सेकंड को "2 मिनट पहले" जैसे अधिक पठनीय स्ट्रिंग में परिवर्तित करना। पुस्तकालय डेटा को विभिन्न तरीकों से प्रारूपित कर सकता है, जिसमें अल्पविरामों के साथ संख्याओं को स्वरूपित करना, टाइमस्टैम्प को सापेक्ष समय में परिवर्तित करना, और बहुत कुछ शामिल है।
मैं अक्सर अपनी डेटा इंजीनियरिंग परियोजनाओं के लिए पूर्णांक और टाइमस्टैम्प का उपयोग करता हूं।
!पिप मानवीयकरण स्थापित करें
# पुस्तकालय आयात आयात डेटाटाइम को डीटी के रूप में आयात करें # अल्पविराम के साथ संख्याओं का प्रारूपण a = humanize.intcomma(951009) # संख्याओं को शब्दों में परिवर्तित करना b = humanize.intword (10046328394) #प्रिंटिंग प्रिंट (ए) प्रिंट (बी)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) प्रिंट(a) प्रिंट(b)
Ercole Palmeri
रंग भरने के माध्यम से बढ़िया मोटर कौशल विकसित करना बच्चों को लेखन जैसे अधिक जटिल कौशल के लिए तैयार करता है। रंग भरना…
नौसैनिक क्षेत्र एक सच्ची वैश्विक आर्थिक शक्ति है, जो 150 अरब के बाज़ार की ओर बढ़ चुका है...
पिछले सोमवार को, फाइनेंशियल टाइम्स ने OpenAI के साथ एक समझौते की घोषणा की। एफटी अपनी विश्व स्तरीय पत्रकारिता को लाइसेंस देता है...
लाखों लोग स्ट्रीमिंग सेवाओं के लिए मासिक सदस्यता शुल्क का भुगतान करते हैं। यह आम राय है कि आप...