ในบทความนี้เราจะเห็นไลบรารี่หลามที่ไม่ค่อยมีใครรู้จัก แต่มีประโยชน์มาก:
แม้ว่าจะมีห้องสมุดหลายแห่งให้บริการใน หลาม สำหรับ DateTime ฉันพบว่า Pendulum ใช้งานง่ายกับการดำเนินการวันที่ใดๆ ลูกตุ้มเป็นตู้หนังสือที่ฉันโปรดปรานสำหรับใช้ทุกวันในที่ทำงาน ขยายโมดูล Python datetime ในตัว เพิ่ม API ที่ใช้งานง่ายยิ่งขึ้นสำหรับการจัดการโซนเวลาและการดำเนินการวันที่และเวลา เช่น การเพิ่มช่วงเวลา การลบวันที่ และการแปลงระหว่างโซนเวลา ให้ API ที่ง่ายและใช้งานง่ายสำหรับการจัดรูปแบบวันที่และเวลา
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
คุณเคยพบเมื่อภาษาต่างประเทศในข้อมูลไม่ปรากฏอย่างถูกต้องหรือไม่? สิ่งนี้เรียกว่าโมจิเบค Mojibake เป็นคำที่ใช้อธิบายข้อความที่อ่านไม่ออกหรือมีสัญญาณรบกวนซึ่งเกิดขึ้นจากปัญหาในการเข้ารหัสหรือถอดรหัส มักเกิดขึ้นเมื่อข้อความที่เขียนด้วยการเข้ารหัสอักขระตัวเดียวถูกถอดรหัสอย่างไม่ถูกต้องโดยใช้การเข้ารหัสอื่น ไลบรารี ftfy python จะช่วยแก้ไข Mojibake ซึ่งมีประโยชน์มากในกรณีใช้ NLP
!pip ติดตั้ง ftfy
พิมพ์(ftfy.fix_text('แก้ไขประโยคโดยใช้ “ftfyâ€\x9d.')) พิมพ์(ftfy.fix_text('âœ" ไม่มีปัญหากับข้อความ')) พิมพ์(ftfy.fix_text('à perturber la réflexion '))
นอกจาก Mojibake แล้ว ftfy จะแก้ไขการเข้ารหัสที่ไม่ดี การลงท้ายบรรทัดที่ไม่ดี และคำพูดที่ไม่ดี อาจเข้าใจข้อความที่ถูกถอดรหัสเป็นหนึ่งในการเข้ารหัสต่อไปนี้:
Sketch เป็นผู้ช่วยเขียนโค้ด AI ที่ไม่เหมือนใครซึ่งออกแบบมาโดยเฉพาะสำหรับผู้ใช้ที่ทำงานกับไลบรารีแพนด้าใน Python ใช้อัลกอริทึมการเรียนรู้ของเครื่องเพื่อทำความเข้าใจบริบทของข้อมูลผู้ใช้และให้คำแนะนำโค้ดที่เกี่ยวข้องเพื่อให้การจัดการและวิเคราะห์ข้อมูลง่ายขึ้นและมีประสิทธิภาพมากขึ้น Sketch ไม่ต้องการให้ผู้ใช้ติดตั้งปลั๊กอินเพิ่มเติมใน IDE ทำให้ใช้งานได้ง่ายและรวดเร็ว สิ่งนี้สามารถลดเวลาและความพยายามที่จำเป็นสำหรับงานที่เกี่ยวข้องกับข้อมูลได้อย่างมาก และช่วยให้ผู้ใช้เขียนโค้ดได้ดีขึ้นและมีประสิทธิภาพมากขึ้น
!pip ร่างการติดตั้ง
เราจำเป็นต้องเพิ่มนามสกุล .sketch ให้กับ pandas dataframe เพื่อใช้ไลบรารีนี้
ถาม เป็นคุณลักษณะของ Sketch ที่ช่วยให้ผู้ใช้สามารถถามคำถามเกี่ยวกับข้อมูลของตนในรูปแบบภาษาธรรมชาติ ให้คำตอบตามข้อความสำหรับคำถามของผู้ใช้
# การนำเข้าไลบรารี นำเข้าภาพร่าง นำเข้าหมีแพนด้าเป็น pd # การอ่านข้อมูล (โดยใช้ข้อมูล twitter เป็นตัวอย่าง) df = pd.read_csv("tweets.csv") พิมพ์(df)
# การถามว่าคอลัมน์ใดเป็นประเภทประเภท df.sketch.ask ("คอลัมน์ใดเป็นประเภทประเภท")
# หากต้องการค้นหารูปร่างของ dataframe df.sketch.ask("รูปร่างของ dataframe คืออะไร")
.sketch.howto
howto เป็นคุณลักษณะที่ให้กลุ่มรหัสที่สามารถใช้เป็นจุดเริ่มต้นหรือจุดสิ้นสุดสำหรับงานที่เกี่ยวข้องกับข้อมูลต่างๆ เราสามารถขอตัวอย่างโค้ดเพื่อปรับข้อมูลให้เป็นมาตรฐาน สร้างคุณสมบัติใหม่ ติดตามข้อมูล และแม้แต่สร้างโมเดล สิ่งนี้จะช่วยประหยัดเวลาและทำให้ง่ายต่อการคัดลอกและวางโค้ด คุณไม่จำเป็นต้องเขียนโค้ดด้วยตนเองตั้งแต่เริ่มต้น
# ขอโค้ดสนิปสำหรับการแสดงอารมณ์ df.sketch.howto("แสดงภาพอารมณ์")
.sketch.สมัคร
ฟังก์ชัน .apply ช่วยสร้างคุณสมบัติใหม่ แยกวิเคราะห์ฟิลด์ และดำเนินการจัดการข้อมูลอื่นๆ ในการใช้คุณสมบัตินี้ เราจำเป็นต้องมีบัญชี OpenAI และใช้คีย์ API เพื่อดำเนินการ ฉันไม่ได้ลองใช้คุณลักษณะนี้
ฉันชอบใช้ห้องสมุดนี้โดยเฉพาะ อย่างไร มันใช้งานได้และฉันคิดว่ามันมีประโยชน์
“pgeocode” เป็นห้องสมุดที่ยอดเยี่ยมที่ฉันเพิ่งค้นพบว่ามีประโยชน์อย่างเหลือเชื่อสำหรับโครงการวิเคราะห์เชิงพื้นที่ของฉัน ตัวอย่างเช่น ช่วยให้คุณค้นหาระยะห่างระหว่างรหัสไปรษณีย์สองรหัสและให้ข้อมูลทางภูมิศาสตร์โดยป้อนประเทศและรหัสไปรษณีย์เป็นอินพุต
!pip ติดตั้ง pgeocode
รับข้อมูลทางภูมิศาสตร์สำหรับรหัสไปรษณีย์เฉพาะ
# กำลังตรวจสอบประเทศ "อินเดีย" nomi = pgeocode.Nominatim('In') # รับข้อมูลทางภูมิศาสตร์โดยส่งรหัสไปรษณีย์ nomi.query_postal_code(["620018", "620017", "620012"])
“pgeocode” คำนวณระยะห่างระหว่างรหัสไปรษณีย์ XNUMX รหัสโดยรับข้อมูลประเทศและรหัสไปรษณีย์ ผลลัพธ์จะแสดงเป็นกิโลเมตร
# การหาระยะทางระหว่างรหัสไปรษณีย์สองอัน Distance = pgeocode.GeoDistance('In') Distance.query_postal_code("620018", "620012")
rembg เป็นอีกหนึ่งไลบรารีที่มีประโยชน์ที่สามารถลบพื้นหลังออกจากรูปภาพได้อย่างง่ายดาย
!pip ติดตั้ง rembg
# นำเข้าห้องสมุด
จากการนำเข้า rembg ลบเส้นทางนำเข้า cv2 # ของอิมเมจอินพุต (ไฟล์ของฉัน: image.jpeg) input_path = 'image.jpeg' # เส้นทางสำหรับบันทึกอิมเมจเอาต์พุตและบันทึกเป็น output.jpeg output_path = 'output.jpeg' # การอ่านอินพุต อินพุตรูปภาพ = cv2.imread(input_path) # การลบเอาต์พุตพื้นหลัง = ลบ(อินพุต) # กำลังบันทึกไฟล์ cv2.imwrite(output_path, เอาต์พุต)
คุณอาจคุ้นเคยกับไลบรารีเหล่านี้มาบ้างแล้ว แต่สำหรับผม Sketch, Pendulum, pgeocode และ ftfy เป็นสิ่งที่ขาดไม่ได้สำหรับงานด้านวิศวกรรมข้อมูลของผม ฉันพึ่งพาพวกเขามากสำหรับโครงการของฉัน
Humanize” ให้การจัดรูปแบบสตริงที่เรียบง่ายและอ่านง่ายสำหรับตัวเลข วันที่ และเวลา เป้าหมายของไลบรารีคือการนำข้อมูลไปใช้และทำให้เป็นมิตรกับผู้ใช้มากขึ้น ตัวอย่างเช่น โดยการแปลงจำนวนวินาทีให้เป็นสตริงที่อ่านง่ายขึ้น เช่น "2 นาทีที่แล้ว" ไลบรารีสามารถจัดรูปแบบข้อมูลได้หลายวิธี รวมถึงการจัดรูปแบบตัวเลขด้วยเครื่องหมายจุลภาค การแปลงการประทับเวลาเป็นเวลาสัมพัทธ์ และอื่นๆ
ฉันมักจะใช้จำนวนเต็มและการประทับเวลาสำหรับโครงการวิศวกรรมข้อมูลของฉัน
!pip ติดตั้งทำให้เป็นมนุษย์
# การนำเข้าไลบรารี่ นำเข้าข้อมูลวันที่และเวลานำเข้าในรูปแบบ dt
นำเข้าทำให้เป็นมนุษย์ นำเข้าวันที่และเวลาเป็น dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
ผู้คนนับล้านชำระค่าบริการสตรีมมิ่ง โดยจ่ายค่าธรรมเนียมการสมัครสมาชิกรายเดือน เป็นความเห็นทั่วไปที่คุณ...
Coveware by Veeam จะยังคงให้บริการตอบสนองต่อเหตุการณ์การขู่กรรโชกทางไซเบอร์ต่อไป Coveware จะนำเสนอความสามารถในการนิติเวชและการแก้ไข...
การบำรุงรักษาเชิงคาดการณ์กำลังปฏิวัติภาคส่วนน้ำมันและก๊าซ ด้วยแนวทางเชิงรุกและนวัตกรรมในการจัดการโรงงาน...
UK CMA ได้ออกคำเตือนเกี่ยวกับพฤติกรรมของ Big Tech ในตลาดปัญญาประดิษฐ์ ที่นั่น…