Pertanyaan Rentang Unicode untuk bahasa Jepang


Saya mencoba memisahkan karakter bahasa Inggris dan Jepang. Saya harus menemukan kisaran Unicode dari semua karakter Jepang. Berapa kisaran Unicode dari semua karakter Jepang?


17
2017-11-11 05:36


asal


Jawaban:


CJK (Cina Jepang dan Korea), Hiragana dan Katakana (termasuk Halfabel Katakana)

http://www.unicode.org/charts/


5
2017-11-13 04:58



Seperti yang disebutkan zawhtut, halaman ini memiliki referensi untuk beberapa rentang unicode. Untuk meringkas rentang:

  • Tanda baca gaya Jepang (3000 - 303f)
  • Hiragana (3040 - 309f)
  • Katakana (30a0 - 30ff)
  • Karakter roman lebar penuh dan katakana lebar-tengah (ff00 - ffef)
  • CJK unifed ideographs - Common and uncommon kanji (4e00 - 9faf)

30
2018-05-12 19:54



Silakan lihat ini halaman untuk referensi. Ini mengandung katakana, Hiragana dan Kanji unicode.


6
2017-11-26 07:31



Berapa kisaran Unicode dari semua karakter Jepang?

Silahkan lihat halaman Data benchmark WiLI untuk ditulis identifikasi bahasa, khususnya tabel II. Nomor dalam kurung adalah bagian dari bahasa yang Anda ambil dengan kisaran kode Unicode (dalam desimal).

  • 12352 - 12543: Jepang (48,73%), Inggris (0,00%)
  • 19000 - 44000: Jepang (32,78%), Inggris (0,00%)
  • 20 - 128: Bahasa Inggris (99,74%), Jepang (11,58%)

Anda dapat melihat bahwa 20 - 128 menangkap bahasa Inggris dengan sangat baik dan semua 3 blok itu penting untuk bahasa Jepang, tetapi bagian yang masih besar tidak ada.

Angka-angka itu dibuat dengan lidtk dan WiLI-2018.


1
2018-01-25 05:48