Мне нужно взять строку смешанных азиатских символов (сейчас предположим, что это только китайские иероглифы или японские иероглифы/хирагана/катакана) и «буквенно-цифровые» (т.
1) считать каждого азиатского ПЕРСОНАЖА за 1; 2) считать каждое буквенно-цифровое СЛОВО за 1;
несколько примеров:
株式会社myCompany = 4 символа + 1 слово = всего 5 символов 株式会社マイコ = 7 символов
моя единственная идея до сих пор заключается в использовании:
var wordArray=val.split(/\w+/);
а затем проверьте каждый элемент, чтобы увидеть, является ли его содержимое буквенно-цифровым (поэтому считается как 1) или нет (поэтому возьмите длину массива). Но я не чувствую, что это действительно очень умно, и подсчитываемый текст может достигать 10 000 слов, так что не очень быстро.
Идеи?