వ్యాసాలు

అద్భుతమైన, కానీ అంతగా తెలియని పైథాన్ లైబ్రరీలు

పైథాన్ ప్రోగ్రామర్ ఎల్లప్పుడూ కొత్త లైబ్రరీల కోసం వెతుకుతుంది, ఇది డేటా ఇంజనీరింగ్ మరియు బిజినెస్ ఇంటెలిజెన్స్ ప్రాజెక్ట్‌లలో పనిని మెరుగుపరుస్తుంది.

ఈ కథనంలో మనం చాలా తక్కువగా తెలిసిన, కానీ చాలా ఉపయోగకరమైన పైథాన్ లైబ్రరీలను చూస్తాము:

1. లోలకం

అనేక లైబ్రరీలు అందుబాటులో ఉన్నప్పటికీ పైథాన్ DateTime కోసం, ఏదైనా తేదీ ఆపరేషన్‌లో పెండ్యులమ్‌ని ఉపయోగించడం సులభం అని నేను భావిస్తున్నాను. పనిలో నా రోజువారీ ఉపయోగం కోసం లోలకం నాకు ఇష్టమైన బుక్‌కేస్. అంతర్నిర్మిత పైథాన్ డేట్‌టైమ్ మాడ్యూల్‌ను విస్తరిస్తుంది, సమయ మండలాలను నిర్వహించడానికి మరియు సమయ వ్యవధిని జోడించడం, తేదీలను తీసివేయడం మరియు సమయ మండలాల మధ్య మార్చడం వంటి తేదీ మరియు సమయ కార్యకలాపాలను నిర్వహించడానికి మరింత స్పష్టమైన APIని జోడిస్తుంది. తేదీలు మరియు సమయాలను ఫార్మాటింగ్ చేయడానికి సులభమైన మరియు స్పష్టమైన APIని అందిస్తుంది.

ఇన్‌స్టాలజియోన్
!pip install pendulum
ఉదాహరణకు
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
అవుట్పుట్

2. ftfy

డేటాలోని విదేశీ భాష సరిగ్గా కనిపించనప్పుడు మీరు ఎదుర్కొన్నారా? దీనినే మోజిబేక్ అంటారు. మోజిబేక్ అనేది ఎన్‌కోడింగ్ లేదా డీకోడింగ్ సమస్యల ఫలితంగా సంభవించే గార్బుల్డ్ లేదా స్క్రాంబుల్డ్ టెక్స్ట్‌ను వివరించడానికి ఉపయోగించే పదం. ఒక అక్షరం ఎన్‌కోడింగ్‌తో వ్రాసిన వచనం వేరే ఎన్‌కోడింగ్‌ని ఉపయోగించి తప్పుగా డీకోడ్ చేయబడినప్పుడు ఇది సాధారణంగా సంభవిస్తుంది. ftfy పైథాన్ లైబ్రరీ Mojibakeని పరిష్కరించడంలో మీకు సహాయం చేస్తుంది, ఇది NLP వినియోగ సందర్భాలలో చాలా ఉపయోగకరంగా ఉంటుంది.

ఇన్‌స్టాలజియోన్
!పిప్ ఇన్‌స్టాల్ ftfy
ఉదాహరణకు
ప్రింట్(ftfy.fix_text('“ftfyâ€\x9d.'ని ఉపయోగించి వాక్యాన్ని సరిచేయండి.)) ప్రింట్(ftfy.fix_text('âœ" టెక్స్ట్‌తో సమస్యలు లేవు')) ప్రింట్(ftfy.fix_text('à perturber la ré flexion '))
అవుట్పుట్

మోజిబేక్‌తో పాటు, ftfy చెడు ఎన్‌కోడింగ్‌లు, చెడు లైన్ ముగింపులు మరియు చెడు కోట్‌లను పరిష్కరిస్తుంది. కింది ఎన్‌కోడింగ్‌లలో ఒకటిగా డీకోడ్ చేయబడిన వచనాన్ని అర్థం చేసుకోవచ్చు:

  • లాటిన్-1 (ISO-8859–1)
  • Windows-1252 (cp1252 — Microsoft ఉత్పత్తులలో ఉపయోగించబడింది)
  • Windows-1251 (cp1251 — cp1252 యొక్క రష్యన్ వెర్షన్)
  • Windows-1250 (cp1250 — cp1252 యొక్క తూర్పు యూరోపియన్ వెర్షన్)
  • ISO-8859–2 (ఇది ఖచ్చితంగా Windows-1250 వలె లేదు)
  • MacRoman (Mac OS 9 మరియు అంతకు ముందు ఉపయోగించబడింది)
  • cp437 (MS-DOS మరియు Windows కమాండ్ ప్రాంప్ట్ యొక్క కొన్ని వెర్షన్‌లలో ఉపయోగించబడుతుంది)

3. స్కెచ్

స్కెచ్ అనేది పైథాన్‌లోని పాండాస్ లైబ్రరీతో పనిచేసే వినియోగదారుల కోసం ప్రత్యేకంగా రూపొందించబడిన ఒక ప్రత్యేకమైన AI కోడింగ్ అసిస్టెంట్. ఇది వినియోగదారు డేటా యొక్క సందర్భాన్ని అర్థం చేసుకోవడానికి మెషిన్ లెర్నింగ్ అల్గారిథమ్‌లను ఉపయోగిస్తుంది మరియు డేటా మానిప్యులేషన్ మరియు విశ్లేషణ పనులను సులభంగా మరియు మరింత సమర్థవంతంగా చేయడానికి సంబంధిత కోడ్ సూచనలను అందిస్తుంది. స్కెచ్‌కి వినియోగదారులు తమ IDEలో అదనపు ప్లగ్-ఇన్‌లను ఇన్‌స్టాల్ చేయాల్సిన అవసరం లేదు, ఇది త్వరితంగా మరియు సులభంగా ఉపయోగించడానికి. ఇది డేటా-సంబంధిత పనులకు అవసరమైన సమయం మరియు శ్రమను గణనీయంగా తగ్గిస్తుంది మరియు వినియోగదారులు మెరుగైన, మరింత సమర్థవంతమైన కోడ్‌ను వ్రాయడంలో సహాయపడుతుంది.

ఇన్‌స్టాలజియోన్
!పిప్ ఇన్‌స్టాల్ స్కెచ్
ఉదాహరణకు

ఈ లైబ్రరీని ఉపయోగించడానికి మేము పాండాస్ డేటాఫ్రేమ్‌కి .స్కెచ్ ఎక్స్‌టెన్షన్‌ని జోడించాలి.

.sketch.ask

అడగండి అనేది స్కెచ్ యొక్క లక్షణం, ఇది వినియోగదారులు తమ డేటా గురించి సహజ భాషా ఆకృతిలో ప్రశ్నలు అడగడానికి అనుమతిస్తుంది. వినియోగదారు ప్రశ్నకు వచన-ఆధారిత ప్రతిస్పందనను అందిస్తుంది.

# లైబ్రరీలను దిగుమతి చేయడం pd వలె స్కెచ్ దిగుమతి పాండాలను దిగుమతి చేయడం # డేటాను చదవడం (ట్విట్టర్ డేటాను ఉదాహరణగా ఉపయోగించడం) df = pd.read_csv("tweets.csv") print(df)
# ఏ నిలువు వరుసలు వర్గం అని అడగడం రకం df.sketch.ask("ఏ నిలువు వరుసలు వర్గం రకం?")
అవుట్పుట్
# డేటాఫ్రేమ్ ఆకారాన్ని కనుగొనడానికి df.sketch.ask("డేటాఫ్రేమ్ యొక్క ఆకృతి ఏమిటి")

.sketch.howto

ఎలా చేయాలి వివిధ డేటా-సంబంధిత పనుల కోసం ప్రారంభ లేదా ముగింపు బిందువుగా ఉపయోగించగల కోడ్ బ్లాక్‌ను అందించే లక్షణం. మేము వారి డేటాను సాధారణీకరించడానికి, కొత్త ఫీచర్‌లను సృష్టించడానికి, డేటాను ట్రాక్ చేయడానికి మరియు మోడల్‌లను రూపొందించడానికి కూడా కోడ్ స్నిప్పెట్‌లను అడగవచ్చు. ఇది సమయాన్ని ఆదా చేస్తుంది మరియు కోడ్‌ను కాపీ చేయడం మరియు అతికించడం సులభం చేస్తుంది; మీరు కోడ్‌ను మొదటి నుండి మానవీయంగా వ్రాయవలసిన అవసరం లేదు.

# భావోద్వేగాలను దృశ్యమానం చేయడం కోసం స్నిప్ చేసిన కోడ్‌ను అందించమని అడుగుతోంది df.sketch.howto("భావోద్వేగాలను విజువలైజ్ చేయండి")
అవుట్పుట్

.sketch.apply

.apply ఫంక్షన్ ఇది కొత్త ఫీచర్‌లను రూపొందించడంలో, ఫీల్డ్‌లను అన్వయించడంలో మరియు ఇతర డేటా మానిప్యులేషన్‌లను చేయడంలో సహాయపడుతుంది. ఈ లక్షణాన్ని ఉపయోగించడానికి, మేము OpenAI ఖాతాను కలిగి ఉండాలి మరియు విధులను నిర్వహించడానికి API కీని ఉపయోగించాలి. నేను ఈ ఫీచర్‌ని ప్రయత్నించలేదు.

నేను ముఖ్యంగా ఈ లైబ్రరీని ఉపయోగించడం ఆనందించాను వచ్చి ఇది పని చేస్తుంది మరియు నేను ఉపయోగకరంగా ఉన్నాను.

4. pgecode

"pgeocode" అనేది ఒక అద్భుతమైన లైబ్రరీ, ఇది నా ప్రాదేశిక విశ్లేషణ ప్రాజెక్ట్‌లకు చాలా ఉపయోగకరంగా ఉంది. ఉదాహరణకు, ఇది రెండు పోస్టల్ కోడ్‌ల మధ్య దూరాన్ని కనుగొనడానికి మిమ్మల్ని అనుమతిస్తుంది మరియు దేశం మరియు పోస్టల్ కోడ్‌ను ఇన్‌పుట్‌గా తీసుకోవడం ద్వారా భౌగోళిక సమాచారాన్ని అందిస్తుంది.

ఇన్‌స్టాలజియోన్
!పిప్ ఇన్‌స్టాల్ pgecode
ఉదాహరణకు

నిర్దిష్ట పోస్ట్‌కోడ్‌ల కోసం భౌగోళిక సమాచారాన్ని పొందండి

# దేశం "ఇండియా" నోమి కోసం తనిఖీ చేస్తోంది.
అవుట్పుట్

“pgeocode” దేశం మరియు పోస్ట్‌కోడ్‌లను ఇన్‌పుట్‌గా తీసుకోవడం ద్వారా రెండు పోస్ట్‌కోడ్‌ల మధ్య దూరాన్ని గణిస్తుంది. ఫలితం కిలోమీటర్లలో వ్యక్తీకరించబడింది.

# రెండు పోస్ట్‌కోడ్‌ల మధ్య దూరాన్ని కనుగొనడం దూరం = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
అవుట్పుట్

5. rembg

rembg మరొక ఉపయోగకరమైన లైబ్రరీ, ఇది చిత్రాల నుండి నేపథ్యాన్ని సులభంగా తొలగిస్తుంది.

ఇన్‌స్టాలజియోన్
!పిప్ ఇన్‌స్టాల్ rembg
ఉదాహరణకు
# లైబ్రరీలను దిగుమతి చేస్తోంది
rembg దిగుమతి నుండి దిగుమతిని తీసివేయండి cv2 # ఇన్‌పుట్ ఇమేజ్ యొక్క పాత్ (నా ఫైల్: image.jpeg) input_path = 'image.jpeg' # అవుట్‌పుట్ ఇమేజ్‌ని సేవ్ చేయడానికి మరియు అవుట్‌పుట్‌గా సేవ్ చేయడానికి మార్గం.jpeg output_path = 'output.jpeg' # ఇన్‌పుట్ చదవడం ఇమేజ్ ఇన్‌పుట్ = cv2.imread(input_path) # నేపథ్య అవుట్‌పుట్‌ను తీసివేయడం = తీసివేయడం(ఇన్‌పుట్) # ఫైల్‌ను సేవ్ చేస్తోంది cv2.imwrite(output_path, output)
అవుట్పుట్

ఈ లైబ్రరీలలో కొన్నింటిని మీకు ఇప్పటికే తెలిసి ఉండవచ్చు, కానీ నాకు, స్కెచ్, పెండ్యులం, pgeocode మరియు ftfy నా డేటా ఇంజనీరింగ్ పనికి ఎంతో అవసరం. నా ప్రాజెక్ట్‌ల కోసం నేను వారిపైనే ఎక్కువగా ఆధారపడతాను.

6. మానవీకరించండి

మానవీకరించు” సంఖ్యలు, తేదీలు మరియు సమయాల కోసం సరళమైన, సులభంగా చదవగలిగే స్ట్రింగ్ ఫార్మాటింగ్‌ను అందిస్తుంది. లైబ్రరీ యొక్క లక్ష్యం డేటాను తీసుకోవడం మరియు దానిని మరింత యూజర్ ఫ్రెండ్లీగా చేయడం, ఉదాహరణకు "2 నిమిషాల క్రితం" వంటి అనేక సెకన్లను మరింత చదవగలిగే స్ట్రింగ్‌గా మార్చడం ద్వారా. లైబ్రరీ డేటాను వివిధ మార్గాల్లో ఫార్మాట్ చేయగలదు, కామాలతో సంఖ్యలను ఫార్మాటింగ్ చేయడం, టైమ్‌స్టాంప్‌లను సంబంధిత సమయాలకు మార్చడం మరియు మరిన్నింటితో సహా.

నేను తరచుగా నా డేటా ఇంజనీరింగ్ ప్రాజెక్ట్‌ల కోసం పూర్ణాంకాలు మరియు టైమ్‌స్టాంప్‌లను ఉపయోగిస్తాను.

ఇన్‌స్టాలజియోన్
!పిప్ ఇన్‌స్టాల్ హ్యూమనైజ్ చేయండి
ఉదాహరణ (పూర్ణాంకాలు)
# లైబ్రరీ దిగుమతి మానవీకరణ దిగుమతి తేదీ సమయాన్ని dt వలె దిగుమతి చేయడం # కామాతో సంఖ్యలను ఫార్మాటింగ్ చేయడం a = humanize.intcomma(951009) # సంఖ్యలను పదాలుగా మార్చడం b = humanize.intword(10046328394) #printing print(a) print(b)
అవుట్పుట్
ఉదాహరణ (తేదీ మరియు సమయం)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) ప్రింట్(a) print(b)

Ercole Palmeri

ఇన్నోవేషన్ వార్తాలేఖ
ఆవిష్కరణకు సంబంధించిన అత్యంత ముఖ్యమైన వార్తలను మిస్ చేయవద్దు. ఇమెయిల్ ద్వారా వాటిని స్వీకరించడానికి సైన్ అప్ చేయండి.
టాగ్లు: పైథాన్

ఇటీవల కథనాలు

ఆగ్మెంటెడ్ రియాలిటీలో వినూత్న జోక్యం, కాటానియా పాలిక్లినిక్‌లో ఆపిల్ వ్యూయర్‌తో

ఆపిల్ విజన్ ప్రో కమర్షియల్ వ్యూయర్‌ని ఉపయోగించి ఆప్తాల్మోప్లాస్టీ ఆపరేషన్ కాటానియా పాలిక్లినిక్‌లో నిర్వహించబడింది…

మే 29 మే

పిల్లల కోసం పేజీలను కలరింగ్ చేయడం వల్ల కలిగే ప్రయోజనాలు - అన్ని వయసుల వారికి మేజిక్ ప్రపంచం

కలరింగ్ ద్వారా చక్కటి మోటారు నైపుణ్యాలను పెంపొందించుకోవడం, రాయడం వంటి క్లిష్టమైన నైపుణ్యాల కోసం పిల్లలను సిద్ధం చేస్తుంది. రంగు వేయడానికి…

మే 29 మే

భవిష్యత్తు ఇక్కడ ఉంది: షిప్పింగ్ పరిశ్రమ గ్లోబల్ ఎకానమీని ఎలా విప్లవాత్మకంగా మారుస్తోంది

నావికా రంగం నిజమైన ప్రపంచ ఆర్థిక శక్తి, ఇది 150 బిలియన్ల మార్కెట్ వైపు నావిగేట్ చేసింది...

మే 29 మే

ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ ద్వారా ప్రాసెస్ చేయబడిన సమాచార ప్రవాహాన్ని నియంత్రించడానికి ప్రచురణకర్తలు మరియు OpenAI ఒప్పందాలపై సంతకం చేస్తారు

గత సోమవారం, ఫైనాన్షియల్ టైమ్స్ OpenAIతో ఒప్పందాన్ని ప్రకటించింది. FT దాని ప్రపంచ స్థాయి జర్నలిజానికి లైసెన్స్ ఇస్తుంది…

ఏప్రిల్ 29 మంగళవారం

మీ భాషలో ఇన్నోవేషన్ చదవండి

ఇన్నోవేషన్ వార్తాలేఖ
ఆవిష్కరణకు సంబంధించిన అత్యంత ముఖ్యమైన వార్తలను మిస్ చేయవద్దు. ఇమెయిల్ ద్వారా వాటిని స్వీకరించడానికి సైన్ అప్ చేయండి.

మాకు అనుసరించండి

ఇటీవల కథనాలు