PostgreSQL, DBvisualizer และ Salesforce
ฉันกำลังเลือกบันทึกจากตารางฐานข้อมูลและส่งออกเป็นไฟล์ CSV: คั่นด้วยเครื่องหมายจุลภาคและเข้ารหัส UTF8 ฉันส่งไฟล์ไปยังผู้ใช้ที่กำลังอัปโหลดข้อมูลไปยัง Saleforce ฉันไม่รู้จัก Salesforce ดังนั้นฉันจึงไม่รู้เรื่องนี้เลย เธอรายงานว่าข้อมูลบางส่วนในไฟล์แสดงเป็นอักขระซึ่งพูดพล่อยๆ (ไม่ใช่ UTF8) (ดูด้านล่าง)
ดูเหมือนว่าผู้ใช้ของเราบางคนกำลังคัดลอก/วางอีเมลลงในแบบฟอร์มบนเว็บซึ่งจะแทรกอีเมลเหล่านั้นลงในฐานข้อมูลของเรา วันที่จากส่วนหัวของอีเมล (ฉันเชื่อว่า) เป็นข้อความที่แสดงเป็นคำพูดที่ไม่มีความหมาย
11/17/2015 7:26:26 AM
กลายเป็น
‎11‎/‎16‎/‎2015‎ ‎07‎:‎26‎:‎26‎ ‎AM
ข้อความในช่อง db ดูเป็นปกติ เมื่อมีการส่งออกเป็นไฟล์ csv จากนั้นไฟล์นั้นจะถูกดูในตัวแก้ไขข้อความ เช่น Wordpad หรือ Salesforce จากนั้นเธอก็เห็นตัวละครแปลก ๆ
สิ่งนี้จะเกิดขึ้นกับวันที่จากข้อความที่คัดลอก/วางลงใน form/db เท่านั้น ฉันไม่รู้ว่ามีวิธีใดหรือมีวิธีใดที่จะลบอักขระที่ "มองไม่เห็น" เหล่านี้ออก
ในแต่ละครั้งจะมีอักขระสามตัวเหมือนกัน: ‎
ฉันได้ regex_replace() กับสิ่งเหล่านี้เพื่อแยกออก แต่มันใช้งานไม่ได้ ฉันคิดว่าเนื่องจากไม่เห็นพวกมันในช่อง db regex จึงเห็นพวกมัน
ดูเหมือนว่าแม้ว่าฉันจะไม่เห็นอักขระเหล่านี้ แต่ก็ต้องอยู่ในรูปแบบบางอย่างที่ทำให้แสดงในโปรแกรมแก้ไขข้อความ เช่น Wordpad หรือไคลเอนต์ Salesforce หลังจากส่งออกเป็น csv
ฉันอาจจะทำการค้นหา/ค้นหา/แทนที่จำนวนมากในโปรแกรมแก้ไขข้อความได้ แต่จะเป็นการดีถ้าทำเช่นนี้ใน sql และหลีกเลี่ยงขั้นตอนพิเศษในแต่ละครั้ง
หวังว่ามีคนเห็นสิ่งนี้และรู้วิธีแก้ปัญหาง่ายๆ
ขอบคุณสำหรับแนวคิดหรือคำแนะนำที่อาจช่วยได้