ฉันต้องใช้อักขระเอเชียผสมจำนวนหนึ่ง (สำหรับตอนนี้ สมมติว่าใช้เฉพาะคันจิจีนหรือคันจิ/ฮิระงะนะ/คาตาคานะของญี่ปุ่น) และ "ตัวอักษรและตัวเลข" (เช่น อังกฤษ ฝรั่งเศส) แล้วนับด้วยวิธีต่อไปนี้:
1) นับตัวละครเอเชียแต่ละตัวเป็น 1; 2) นับแต่ละคำตัวอักษรและตัวเลขเป็น 1;
ตัวอย่างบางส่วน:
株式会社myCompany = 4 ตัวอักษร + 1 คำ = ทั้งหมด 5 ตัวอักษร 株式会社マイECO = 7 ตัวอักษร
ความคิดเดียวของฉันจนถึงตอนนี้คือใช้:
var wordArray=val.split(/\w+/);
จากนั้นตรวจสอบแต่ละองค์ประกอบเพื่อดูว่าเนื้อหาเป็นตัวอักษรและตัวเลข (ดังนั้นนับเป็น 1) หรือไม่ (ดังนั้นใช้ความยาวของอาร์เรย์) แต่ฉันรู้สึกว่ามันไม่ฉลาดเลยจริงๆ และการนับข้อความอาจมีมากถึง 10,000 คำ ดังนั้นจึงไม่รวดเร็วนัก
ไอเดีย?