இந்த கட்டுரையில் நாம் அதிகம் அறியப்படாத, ஆனால் மிகவும் பயனுள்ள பைதான் நூலகங்களைக் காண்கிறோம்:
பல நூலகங்கள் இருந்தாலும் பைதான் DateTimeக்கு, எந்த தேதி செயல்பாட்டிலும் ஊசல் பயன்படுத்த எளிதானது என்று நான் கருதுகிறேன். வேலையில் எனது அன்றாடப் பயன்பாட்டிற்கு ஒரு ஊசல் எனக்குப் பிடித்த புத்தக அலமாரி. உள்ளமைக்கப்பட்ட பைதான் தேதிநேர தொகுதியை விரிவுபடுத்துகிறது, நேர மண்டலங்களை நிர்வகிப்பதற்கும், நேர இடைவெளிகளைச் சேர்த்தல், தேதிகளைக் கழித்தல் மற்றும் நேர மண்டலங்களுக்கு இடையில் மாற்றுவது போன்ற தேதி மற்றும் நேர செயல்பாடுகளைச் செய்வதற்கும் மிகவும் உள்ளுணர்வு API ஐச் சேர்க்கிறது. தேதிகள் மற்றும் நேரங்களை வடிவமைப்பதற்கான எளிய மற்றும் உள்ளுணர்வு API ஐ வழங்குகிறது.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
தரவுகளில் வெளிநாட்டு மொழி சரியாகத் தோன்றாதபோது நீங்கள் சந்தித்தீர்களா? இதற்கு மோஜிபேக் என்று பெயர். மோஜிபேக் என்பது குறியாக்கம் அல்லது டிகோடிங் சிக்கல்களின் விளைவாக ஏற்படும் சிதைந்த அல்லது துருவல் உரையை விவரிக்கப் பயன்படுத்தப்படும் சொல். ஒரு எழுத்து குறியாக்கத்துடன் எழுதப்பட்ட உரை வேறு குறியாக்கத்தைப் பயன்படுத்தி தவறாக டிகோட் செய்யப்படும்போது இது பொதுவாக நிகழ்கிறது. ftfy python நூலகம் Mojibake ஐ சரிசெய்ய உதவும், இது NLP பயன்பாட்டு நிகழ்வுகளில் மிகவும் பயனுள்ளதாக இருக்கும்.
!பிப் நிறுவல் ftfy
அச்சு(ftfy.fix_text('“ftfyâ€\x9d.' ஐப் பயன்படுத்தி வாக்கியத்தைத் திருத்தவும்.)) அச்சு '))
Mojibake ஐத் தவிர, ftfy மோசமான குறியாக்கங்கள், மோசமான வரி முடிவுகள் மற்றும் மோசமான மேற்கோள்களை சரிசெய்யும். பின்வரும் குறியாக்கங்களில் ஒன்றாக டிகோட் செய்யப்பட்ட உரையைப் புரிந்துகொள்ளலாம்:
ஸ்கெட்ச் என்பது பைத்தானில் உள்ள பாண்டாஸ் லைப்ரரியில் பணிபுரியும் பயனர்களுக்காக வடிவமைக்கப்பட்ட ஒரு தனித்துவமான AI குறியீட்டு உதவியாளர் ஆகும். இது பயனர் தரவின் சூழலைப் புரிந்துகொள்ள இயந்திர கற்றல் வழிமுறைகளைப் பயன்படுத்துகிறது மற்றும் தரவு கையாளுதல் மற்றும் பகுப்பாய்வு பணிகளை எளிதாகவும் திறமையாகவும் செய்ய தொடர்புடைய குறியீட்டு பரிந்துரைகளை வழங்குகிறது. பயனர்கள் தங்கள் IDE இல் கூடுதல் செருகுநிரல்களை நிறுவ ஸ்கெட்ச் தேவையில்லை, இது விரைவாகவும் எளிதாகவும் பயன்படுத்துகிறது. இது தரவு தொடர்பான பணிகளுக்குத் தேவைப்படும் நேரத்தையும் முயற்சியையும் கணிசமாகக் குறைக்கும் மற்றும் பயனர்கள் சிறந்த, திறமையான குறியீட்டை எழுத உதவும்.
!pip இன்ஸ்டால் ஸ்கெட்ச்
இந்த நூலகத்தைப் பயன்படுத்த, pandas dataframe இல் .sketch நீட்டிப்பைச் சேர்க்க வேண்டும்.
கேட்க ஸ்கெட்சின் ஒரு அம்சமாகும், இது பயனர்கள் தங்கள் தரவைப் பற்றிய கேள்விகளை இயல்பான மொழி வடிவத்தில் கேட்க அனுமதிக்கிறது. பயனரின் கேள்விக்கு உரை அடிப்படையிலான பதிலை வழங்குகிறது.
# நூலகங்களை இறக்குமதி செய்வது ஸ்கெட்ச் இறக்குமதி பாண்டாக்களை pd ஆக இறக்குமதி செய்கிறது # தரவைப் படித்தல் (உதாரணமாக ட்விட்டர் தரவைப் பயன்படுத்தி) df = pd.read_csv("tweets.csv") print(df)
# வகை வகை df.sketch.ask ("எந்த நெடுவரிசைகள் வகை வகை?")
# டேட்டாஃப்ரேமின் வடிவத்தைக் கண்டறிய df.sketch.ask("டேட்டாஃப்ரேமின் வடிவம் என்ன")
.sketch.howto
எப்படிச்செய்வது பல்வேறு தரவு தொடர்பான பணிகளுக்கு தொடக்க அல்லது முடிவுப் புள்ளியாகப் பயன்படுத்தக்கூடிய குறியீட்டின் தொகுதியை வழங்கும் அம்சமாகும். அவற்றின் தரவை இயல்பாக்க, புதிய அம்சங்களை உருவாக்க, தரவைக் கண்காணிக்க மற்றும் மாதிரிகளை உருவாக்க, குறியீட்டின் துணுக்குகளை நாங்கள் கேட்கலாம். இது நேரத்தை மிச்சப்படுத்தும் மற்றும் குறியீட்டை நகலெடுத்து ஒட்டுவதை எளிதாக்கும்; நீங்கள் புதிதாக குறியீட்டை கைமுறையாக எழுத வேண்டியதில்லை.
# உணர்ச்சிகளைக் காட்சிப்படுத்துவதற்காக துண்டிக்கப்பட்ட குறியீட்டை வழங்குமாறு கேட்கிறது df.sketch.howto("உணர்ச்சிகளைக் காட்சிப்படுத்து")
.sketch.apply
The .apply செயல்பாடு இது புதிய அம்சங்களை உருவாக்கவும், புலங்களை அலசவும் மற்றும் பிற தரவு கையாளுதல்களைச் செய்யவும் உதவுகிறது. இந்த அம்சத்தைப் பயன்படுத்த, நாம் OpenAI கணக்கு வைத்திருக்க வேண்டும் மற்றும் பணிகளைச் செய்ய API விசையைப் பயன்படுத்த வேண்டும். நான் இந்த அம்சத்தை முயற்சிக்கவில்லை.
குறிப்பாக இந்த நூலகத்தைப் பயன்படுத்தி மகிழ்ந்தேன் எப்படி அது வேலை செய்கிறது, எனக்கு பயனுள்ளதாக இருக்கிறது.
"pgeocode" என்பது ஒரு சிறந்த நூலகமாகும், இது சமீபத்தில் நான் தடுமாறியது, இது எனது இடஞ்சார்ந்த பகுப்பாய்வு திட்டங்களுக்கு நம்பமுடியாத அளவிற்கு பயனுள்ளதாக இருந்தது. எடுத்துக்காட்டாக, இரண்டு அஞ்சல் குறியீடுகளுக்கு இடையே உள்ள தூரத்தைக் கண்டறிய இது உங்களை அனுமதிக்கிறது மற்றும் ஒரு நாடு மற்றும் அஞ்சல் குறியீட்டை உள்ளீடாக எடுத்து புவியியல் தகவலை வழங்குகிறது.
!பிப் நிறுவல் pgecode
குறிப்பிட்ட அஞ்சல் குறியீடுகளுக்கான புவியியல் தகவலைப் பெறவும்
# "இந்தியா" nomi = pgeocode.Nominatim('In') என்ற நாட்டைச் சரிபார்க்கிறது # nomi.query_postal_code(["620018", "620017", "620012"]) அஞ்சல் குறியீடுகளைக் கடந்து புவிசார் தகவலைப் பெறுதல்
"pgeocode" நாடு மற்றும் அஞ்சல் குறியீடுகளை உள்ளீடாக எடுத்து இரண்டு அஞ்சல் குறியீடுகளுக்கு இடையிலான தூரத்தைக் கணக்கிடுகிறது. முடிவு கிலோமீட்டரில் வெளிப்படுத்தப்படுகிறது.
# இரண்டு அஞ்சல் குறியீடுகளுக்கு இடையே உள்ள தூரத்தைக் கண்டறிதல் தூரம் = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg மற்றொரு பயனுள்ள நூலகமாகும், இது படங்களிலிருந்து பின்னணியை எளிதாக நீக்குகிறது.
!pip நிறுவ rembg
# நூலகங்களை இறக்குமதி செய்தல்
rembg இறக்குமதியிலிருந்து இறக்குமதியை அகற்று cv2 # உள்ளீட்டுப் படத்தின் பாதை (எனது கோப்பு: image.jpeg) input_path = 'image.jpeg' # வெளியீட்டுப் படத்தைச் சேமிப்பதற்கான பாதை மற்றும் ஒரு output.jpeg output_path = 'output.jpeg' # உள்ளீட்டைப் படித்தல் படத்தின் உள்ளீடு = cv2.imread(input_path) # பின்னணி வெளியீட்டை அகற்றுதல் = அகற்று(உள்ளீடு) # கோப்பை சேமிக்கிறது cv2.imwrite(output_path, output)
இந்த நூலகங்களில் சிலவற்றை நீங்கள் ஏற்கனவே அறிந்திருக்கலாம், ஆனால் எனக்கு ஸ்கெட்ச், ஊசல், pgeocode மற்றும் ftfy ஆகியவை எனது தரவுப் பொறியியல் பணிகளுக்கு இன்றியமையாதவை. எனது திட்டங்களுக்கு நான் அவர்களை அதிகம் நம்பியிருக்கிறேன்.
மனிதமயமாக்கல்” எண்கள், தேதிகள் மற்றும் நேரங்களுக்கான எளிய, படிக்க எளிதான சரம் வடிவமைப்பை வழங்குகிறது. லைப்ரரியின் குறிக்கோள், தரவை எடுத்து பயனர்களுக்கு ஏற்றதாக மாற்றுவது, எடுத்துக்காட்டாக, "2 நிமிடங்களுக்கு முன்பு" போன்ற பல வினாடிகளை மேலும் படிக்கக்கூடிய சரமாக மாற்றுவதன் மூலம். காற்புள்ளிகளுடன் எண்களை வடிவமைத்தல், நேர முத்திரைகளை தொடர்புடைய நேரங்களுக்கு மாற்றுதல் மற்றும் பலவற்றை உள்ளடக்கிய பல்வேறு வழிகளில் நூலகம் தரவை வடிவமைக்க முடியும்.
எனது தரவு பொறியியல் திட்டங்களுக்கு நான் அடிக்கடி முழு எண்களையும் நேர முத்திரைகளையும் பயன்படுத்துகிறேன்.
!பிப் இன்ஸ்டால் மனிதனை
# நூலக இறக்குமதி மனிதமயமாக்கல் இறக்குமதி தேதி நேரத்தை dt ஆக இறக்குமதி செய்தல் # கமாவுடன் எண்களை வடிவமைத்தல் a = humanize.intcomma(951009) # எண்களை வார்த்தைகளாக மாற்றுதல் b = humanize.intword(10046328394) #அச்சு அச்சிடுதல்(a) print(b)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
கடற்படைத் துறை ஒரு உண்மையான உலகளாவிய பொருளாதார சக்தியாகும், இது 150 பில்லியன் சந்தையை நோக்கி பயணித்துள்ளது...
கடந்த திங்கட்கிழமை, பைனான்சியல் டைம்ஸ் OpenAI உடன் ஒரு ஒப்பந்தத்தை அறிவித்தது. FT அதன் உலகத் தரம் வாய்ந்த பத்திரிகைக்கு உரிமம் அளிக்கிறது…
மில்லியன் கணக்கான மக்கள் ஸ்ட்ரீமிங் சேவைகளுக்கு பணம் செலுத்துகிறார்கள், மாதாந்திர சந்தா கட்டணத்தை செலுத்துகிறார்கள். நீங்கள் என்பது பொதுவான கருத்து...
Veeam வழங்கும் Coveware இணைய மிரட்டி பணம் பறித்தல் சம்பவத்தின் பதில் சேவைகளை தொடர்ந்து வழங்கும். Coveware தடயவியல் மற்றும் சரிசெய்தல் திறன்களை வழங்கும்…