பொருட்கள்

அற்புதமான, ஆனால் அதிகம் அறியப்படாத பைதான் நூலகங்கள்

பைதான் புரோகிராமர் எப்போதும் புதிய நூலகங்களைத் தேடுகிறார், இது தரவு பொறியியல் மற்றும் வணிக நுண்ணறிவு திட்டங்களில் பணியை மேம்படுத்த முடியும்.

இந்த கட்டுரையில் நாம் அதிகம் அறியப்படாத, ஆனால் மிகவும் பயனுள்ள பைதான் நூலகங்களைக் காண்கிறோம்:

1. ஊசல்

பல நூலகங்கள் இருந்தாலும் பைதான் DateTimeக்கு, எந்த தேதி செயல்பாட்டிலும் ஊசல் பயன்படுத்த எளிதானது என்று நான் கருதுகிறேன். வேலையில் எனது அன்றாடப் பயன்பாட்டிற்கு ஒரு ஊசல் எனக்குப் பிடித்த புத்தக அலமாரி. உள்ளமைக்கப்பட்ட பைதான் தேதிநேர தொகுதியை விரிவுபடுத்துகிறது, நேர மண்டலங்களை நிர்வகிப்பதற்கும், நேர இடைவெளிகளைச் சேர்த்தல், தேதிகளைக் கழித்தல் மற்றும் நேர மண்டலங்களுக்கு இடையில் மாற்றுவது போன்ற தேதி மற்றும் நேர செயல்பாடுகளைச் செய்வதற்கும் மிகவும் உள்ளுணர்வு API ஐச் சேர்க்கிறது. தேதிகள் மற்றும் நேரங்களை வடிவமைப்பதற்கான எளிய மற்றும் உள்ளுணர்வு API ஐ வழங்குகிறது.

நிறுவல்
!pip install pendulum
உதாரணமாக
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
வெளியீடு

2. ftfy

தரவுகளில் வெளிநாட்டு மொழி சரியாகத் தோன்றாதபோது நீங்கள் சந்தித்தீர்களா? இதற்கு மோஜிபேக் என்று பெயர். மோஜிபேக் என்பது குறியாக்கம் அல்லது டிகோடிங் சிக்கல்களின் விளைவாக ஏற்படும் சிதைந்த அல்லது துருவல் உரையை விவரிக்கப் பயன்படுத்தப்படும் சொல். ஒரு எழுத்து குறியாக்கத்துடன் எழுதப்பட்ட உரை வேறு குறியாக்கத்தைப் பயன்படுத்தி தவறாக டிகோட் செய்யப்படும்போது இது பொதுவாக நிகழ்கிறது. ftfy python நூலகம் Mojibake ஐ சரிசெய்ய உதவும், இது NLP பயன்பாட்டு நிகழ்வுகளில் மிகவும் பயனுள்ளதாக இருக்கும்.

நிறுவல்
!பிப் நிறுவல் ftfy
உதாரணமாக
அச்சு(ftfy.fix_text('“ftfyâ€\x9d.' ஐப் பயன்படுத்தி வாக்கியத்தைத் திருத்தவும்.)) அச்சு '))
வெளியீடு

Mojibake ஐத் தவிர, ftfy மோசமான குறியாக்கங்கள், மோசமான வரி முடிவுகள் மற்றும் மோசமான மேற்கோள்களை சரிசெய்யும். பின்வரும் குறியாக்கங்களில் ஒன்றாக டிகோட் செய்யப்பட்ட உரையைப் புரிந்துகொள்ளலாம்:

  • லத்தீன்-1 (ISO-8859–1)
  • Windows-1252 (cp1252 — Microsoft தயாரிப்புகளில் பயன்படுத்தப்படுகிறது)
  • Windows-1251 (cp1251 — cp1252 இன் ரஷ்ய பதிப்பு)
  • Windows-1250 (cp1250 — cp1252 இன் கிழக்கு ஐரோப்பிய பதிப்பு)
  • ISO-8859–2 (இது விண்டோஸ்-1250 போலவே இல்லை)
  • MacRoman (Mac OS 9 மற்றும் அதற்கு முந்தைய பதிப்புகளில் பயன்படுத்தப்பட்டது)
  • cp437 (MS-DOS மற்றும் Windows கட்டளை வரியில் சில பதிப்புகளில் பயன்படுத்தப்படுகிறது)

3. ஸ்கெட்ச்

ஸ்கெட்ச் என்பது பைத்தானில் உள்ள பாண்டாஸ் லைப்ரரியில் பணிபுரியும் பயனர்களுக்காக வடிவமைக்கப்பட்ட ஒரு தனித்துவமான AI குறியீட்டு உதவியாளர் ஆகும். இது பயனர் தரவின் சூழலைப் புரிந்துகொள்ள இயந்திர கற்றல் வழிமுறைகளைப் பயன்படுத்துகிறது மற்றும் தரவு கையாளுதல் மற்றும் பகுப்பாய்வு பணிகளை எளிதாகவும் திறமையாகவும் செய்ய தொடர்புடைய குறியீட்டு பரிந்துரைகளை வழங்குகிறது. பயனர்கள் தங்கள் IDE இல் கூடுதல் செருகுநிரல்களை நிறுவ ஸ்கெட்ச் தேவையில்லை, இது விரைவாகவும் எளிதாகவும் பயன்படுத்துகிறது. இது தரவு தொடர்பான பணிகளுக்குத் தேவைப்படும் நேரத்தையும் முயற்சியையும் கணிசமாகக் குறைக்கும் மற்றும் பயனர்கள் சிறந்த, திறமையான குறியீட்டை எழுத உதவும்.

நிறுவல்
!pip இன்ஸ்டால் ஸ்கெட்ச்
உதாரணமாக

இந்த நூலகத்தைப் பயன்படுத்த, pandas dataframe இல் .sketch நீட்டிப்பைச் சேர்க்க வேண்டும்.

.sketch.ask

கேட்க ஸ்கெட்சின் ஒரு அம்சமாகும், இது பயனர்கள் தங்கள் தரவைப் பற்றிய கேள்விகளை இயல்பான மொழி வடிவத்தில் கேட்க அனுமதிக்கிறது. பயனரின் கேள்விக்கு உரை அடிப்படையிலான பதிலை வழங்குகிறது.

# நூலகங்களை இறக்குமதி செய்வது ஸ்கெட்ச் இறக்குமதி பாண்டாக்களை pd ஆக இறக்குமதி செய்கிறது # தரவைப் படித்தல் (உதாரணமாக ட்விட்டர் தரவைப் பயன்படுத்தி) df = pd.read_csv("tweets.csv") print(df)
# வகை வகை df.sketch.ask ("எந்த நெடுவரிசைகள் வகை வகை?")
வெளியீடு
# டேட்டாஃப்ரேமின் வடிவத்தைக் கண்டறிய df.sketch.ask("டேட்டாஃப்ரேமின் வடிவம் என்ன")

.sketch.howto

எப்படிச்செய்வது பல்வேறு தரவு தொடர்பான பணிகளுக்கு தொடக்க அல்லது முடிவுப் புள்ளியாகப் பயன்படுத்தக்கூடிய குறியீட்டின் தொகுதியை வழங்கும் அம்சமாகும். அவற்றின் தரவை இயல்பாக்க, புதிய அம்சங்களை உருவாக்க, தரவைக் கண்காணிக்க மற்றும் மாதிரிகளை உருவாக்க, குறியீட்டின் துணுக்குகளை நாங்கள் கேட்கலாம். இது நேரத்தை மிச்சப்படுத்தும் மற்றும் குறியீட்டை நகலெடுத்து ஒட்டுவதை எளிதாக்கும்; நீங்கள் புதிதாக குறியீட்டை கைமுறையாக எழுத வேண்டியதில்லை.

# உணர்ச்சிகளைக் காட்சிப்படுத்துவதற்காக துண்டிக்கப்பட்ட குறியீட்டை வழங்குமாறு கேட்கிறது df.sketch.howto("உணர்ச்சிகளைக் காட்சிப்படுத்து")
வெளியீடு

.sketch.apply

The .apply செயல்பாடு இது புதிய அம்சங்களை உருவாக்கவும், புலங்களை அலசவும் மற்றும் பிற தரவு கையாளுதல்களைச் செய்யவும் உதவுகிறது. இந்த அம்சத்தைப் பயன்படுத்த, நாம் OpenAI கணக்கு வைத்திருக்க வேண்டும் மற்றும் பணிகளைச் செய்ய API விசையைப் பயன்படுத்த வேண்டும். நான் இந்த அம்சத்தை முயற்சிக்கவில்லை.

குறிப்பாக இந்த நூலகத்தைப் பயன்படுத்தி மகிழ்ந்தேன் எப்படி அது வேலை செய்கிறது, எனக்கு பயனுள்ளதாக இருக்கிறது.

4. pgecode

"pgeocode" என்பது ஒரு சிறந்த நூலகமாகும், இது சமீபத்தில் நான் தடுமாறியது, இது எனது இடஞ்சார்ந்த பகுப்பாய்வு திட்டங்களுக்கு நம்பமுடியாத அளவிற்கு பயனுள்ளதாக இருந்தது. எடுத்துக்காட்டாக, இரண்டு அஞ்சல் குறியீடுகளுக்கு இடையே உள்ள தூரத்தைக் கண்டறிய இது உங்களை அனுமதிக்கிறது மற்றும் ஒரு நாடு மற்றும் அஞ்சல் குறியீட்டை உள்ளீடாக எடுத்து புவியியல் தகவலை வழங்குகிறது.

நிறுவல்
!பிப் நிறுவல் pgecode
உதாரணமாக

குறிப்பிட்ட அஞ்சல் குறியீடுகளுக்கான புவியியல் தகவலைப் பெறவும்

# "இந்தியா" nomi = pgeocode.Nominatim('In') என்ற நாட்டைச் சரிபார்க்கிறது # nomi.query_postal_code(["620018", "620017", "620012"]) அஞ்சல் குறியீடுகளைக் கடந்து புவிசார் தகவலைப் பெறுதல்
வெளியீடு

"pgeocode" நாடு மற்றும் அஞ்சல் குறியீடுகளை உள்ளீடாக எடுத்து இரண்டு அஞ்சல் குறியீடுகளுக்கு இடையிலான தூரத்தைக் கணக்கிடுகிறது. முடிவு கிலோமீட்டரில் வெளிப்படுத்தப்படுகிறது.

# இரண்டு அஞ்சல் குறியீடுகளுக்கு இடையே உள்ள தூரத்தைக் கண்டறிதல் தூரம் = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
வெளியீடு

5. rembg

rembg மற்றொரு பயனுள்ள நூலகமாகும், இது படங்களிலிருந்து பின்னணியை எளிதாக நீக்குகிறது.

நிறுவல்
!pip நிறுவ rembg
உதாரணமாக
# நூலகங்களை இறக்குமதி செய்தல்
rembg இறக்குமதியிலிருந்து இறக்குமதியை அகற்று cv2 # உள்ளீட்டுப் படத்தின் பாதை (எனது கோப்பு: image.jpeg) input_path = 'image.jpeg' # வெளியீட்டுப் படத்தைச் சேமிப்பதற்கான பாதை மற்றும் ஒரு output.jpeg output_path = 'output.jpeg' # உள்ளீட்டைப் படித்தல் படத்தின் உள்ளீடு = cv2.imread(input_path) # பின்னணி வெளியீட்டை அகற்றுதல் = அகற்று(உள்ளீடு) # கோப்பை சேமிக்கிறது cv2.imwrite(output_path, output)
வெளியீடு

இந்த நூலகங்களில் சிலவற்றை நீங்கள் ஏற்கனவே அறிந்திருக்கலாம், ஆனால் எனக்கு ஸ்கெட்ச், ஊசல், pgeocode மற்றும் ftfy ஆகியவை எனது தரவுப் பொறியியல் பணிகளுக்கு இன்றியமையாதவை. எனது திட்டங்களுக்கு நான் அவர்களை அதிகம் நம்பியிருக்கிறேன்.

6. மனிதாபிமானம்

மனிதமயமாக்கல்” எண்கள், தேதிகள் மற்றும் நேரங்களுக்கான எளிய, படிக்க எளிதான சரம் வடிவமைப்பை வழங்குகிறது. லைப்ரரியின் குறிக்கோள், தரவை எடுத்து பயனர்களுக்கு ஏற்றதாக மாற்றுவது, எடுத்துக்காட்டாக, "2 நிமிடங்களுக்கு முன்பு" போன்ற பல வினாடிகளை மேலும் படிக்கக்கூடிய சரமாக மாற்றுவதன் மூலம். காற்புள்ளிகளுடன் எண்களை வடிவமைத்தல், நேர முத்திரைகளை தொடர்புடைய நேரங்களுக்கு மாற்றுதல் மற்றும் பலவற்றை உள்ளடக்கிய பல்வேறு வழிகளில் நூலகம் தரவை வடிவமைக்க முடியும்.

எனது தரவு பொறியியல் திட்டங்களுக்கு நான் அடிக்கடி முழு எண்களையும் நேர முத்திரைகளையும் பயன்படுத்துகிறேன்.

நிறுவல்
!பிப் இன்ஸ்டால் மனிதனை
எடுத்துக்காட்டு (முழு எண்கள்)
# நூலக இறக்குமதி மனிதமயமாக்கல் இறக்குமதி தேதி நேரத்தை dt ஆக இறக்குமதி செய்தல் # கமாவுடன் எண்களை வடிவமைத்தல் a = humanize.intcomma(951009) # எண்களை வார்த்தைகளாக மாற்றுதல் b = humanize.intword(10046328394) #அச்சு அச்சிடுதல்(a) print(b)
வெளியீடு
உதாரணம் (தேதி மற்றும் நேரம்)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

புதுமை செய்திமடல்
புதுமை பற்றிய மிக முக்கியமான செய்திகளைத் தவறவிடாதீர்கள். மின்னஞ்சல் மூலம் அவற்றைப் பெற பதிவு செய்யவும்.
குறிச்சொற்கள்: மலைப்பாம்பு

சமீபத்திய கட்டுரைகள்

எதிர்காலம் இங்கே உள்ளது: கப்பல் துறை எவ்வாறு உலகப் பொருளாதாரத்தில் புரட்சியை ஏற்படுத்துகிறது

கடற்படைத் துறை ஒரு உண்மையான உலகளாவிய பொருளாதார சக்தியாகும், இது 150 பில்லியன் சந்தையை நோக்கி பயணித்துள்ளது...

29 மே 29

செயற்கை நுண்ணறிவு மூலம் செயலாக்கப்படும் தகவல்களின் ஓட்டத்தை ஒழுங்குபடுத்த வெளியீட்டாளர்கள் மற்றும் OpenAI ஒப்பந்தங்களில் கையெழுத்திடுகின்றனர்

கடந்த திங்கட்கிழமை, பைனான்சியல் டைம்ஸ் OpenAI உடன் ஒரு ஒப்பந்தத்தை அறிவித்தது. FT அதன் உலகத் தரம் வாய்ந்த பத்திரிகைக்கு உரிமம் அளிக்கிறது…

ஏப்ரல் 29 ஏப்ரல்

ஆன்லைன் கொடுப்பனவுகள்: ஸ்ட்ரீமிங் சேவைகள் உங்களை எப்படி எப்போதும் செலுத்த வைக்கின்றன என்பது இங்கே

மில்லியன் கணக்கான மக்கள் ஸ்ட்ரீமிங் சேவைகளுக்கு பணம் செலுத்துகிறார்கள், மாதாந்திர சந்தா கட்டணத்தை செலுத்துகிறார்கள். நீங்கள் என்பது பொதுவான கருத்து...

ஏப்ரல் 29 ஏப்ரல்

பாதுகாப்பிலிருந்து பதில் மற்றும் மீட்பு வரை ransomware க்கான விரிவான ஆதரவை Veeam கொண்டுள்ளது

Veeam வழங்கும் Coveware இணைய மிரட்டி பணம் பறித்தல் சம்பவத்தின் பதில் சேவைகளை தொடர்ந்து வழங்கும். Coveware தடயவியல் மற்றும் சரிசெய்தல் திறன்களை வழங்கும்…

ஏப்ரல் 29 ஏப்ரல்

உங்கள் மொழியில் புதுமையைப் படியுங்கள்

புதுமை செய்திமடல்
புதுமை பற்றிய மிக முக்கியமான செய்திகளைத் தவறவிடாதீர்கள். மின்னஞ்சல் மூலம் அவற்றைப் பெற பதிவு செய்யவும்.

எங்களுக்கு பின்பற்றவும்

சமீபத்திய கட்டுரைகள்

இணைப்பு

ஜீவனாம்சம் சைபர் தாக்குதல் blockchain chatbot அரட்டை gpt மேகம் கிளவுட் கம்ப்யூட்டிங் உள்ளடக்க சந்தைப்படுத்தல் சைபர் தாக்குதல் இணைய பாதுகாப்பு நுகர்வோர் உரிமை இணையவழி எனியா புதுமை நிகழ்வு gianfranco fedele Google செல்வாக்கு கண்டுபிடிப்பு புதுமைக்கு நிதியளித்தல் அதிகரிக்கும் கண்டுபிடிப்பு மருத்துவ கண்டுபிடிப்பு புதுமை நிலைத்தன்மை தொழில்நுட்ப கண்டுபிடிப்பு செயற்கை நுண்ணறிவு சனத்தொகை எந்திர கற்றல் metaverse மைக்ரோசாப்ட் nft சுழலில் மனிதர் இல்லை PHP பதில் ரோபாட்டிக்ஸ் எஸ்சிஓ ஸெர்ப் மென்பொருள் மென்பொருள் வடிவமைப்பு மென்பொருள் மேம்பாடு மென்பொருள் பொறியியல் பேண்தகைமை தொடக்க தேல்ஸ் பயிற்சி VPN web3