日本語概要
このページではマレー語・インドネシア語の2つのデジタル言語資源についてユーザーのために情報を提供しています。
- 形態情報辞書 MALINDO Morph
- コーパス検索システム MALINDO Conc
いずれも日本学術振興会の「頭脳循環を加速する戦略的国際研究ネットワーク推進プログラム」による東京外国語大学とナンヤン工科大学の共同研究を通じて開発されました。事業終了後も、日本学術振興会の「国際的な活躍が期待できる研究者の育成事業」、科学研究費補助金(課題番号26770135, 18K00568)、東京外国語大学アジア・アフリカ言語文化研究所情報資源利用研究センターからの助成のおかげで、新規データの追加、既存データの改訂、システムの改良および保守を継続できています。
東京外国語大学アジア・アフリカ言語文化研究所情報資源利用研究センターのプロジェクト関連部分に関する詳細はこちら。
MALINDO Morph | MALINDO Conc
MALINDO: Sumber bahasa digital untuk bahasa Melayu/Indonesia
MALINDO: マレー語・インドネシア語のためのデジタル言語資源
Sumber bahasa digital MALINDO Morph dan MALINDO Conc adalah hasil kolaborasi di antara Universiti Bahasa Asing Tokyo/Universititas Kajian Asing Tokyo dan Universiti Teknologi Nanyang/Universitas Teknologi Nanyang, Singapura.
MALINDO Morph (kamus morfologi)
MALINDO Morph (形態情報辞書)
Sumber rujukan
引用文献
Nomoto, Hiroki, Hannah Choi, David Moeljadi dan Francis Bond. 2018. MALINDO Morph: Morphological dictionary and analyser for Malay/Indonesian. Kiyoaki Shirai (peny.) Proceedings of the LREC 2018 Workshop "The 13th Workshop on Asian Language Resources", 36-43.
MALINDO Conc (sistem pencarian korpus)
MALINDO Conc (コーパス検索システム)
Panduan Pengguna/Petunjuk Penggunaan
ユーザーガイド
Sumber rujukan untuk sistem MALINDO Conc sendiri
MALINDO Concそのものに対する引用文献
Nomoto, Hiroki, Shiro Akasegawa dan Asako Shiohara. 2018. Building an open online concordancer for Malay/Indonesian. The 22nd International Symposium on Malay/Indonesian Linguistics (ISMIL). 11-12 Mei. Universiti California, Los Angeles, AS. [slaid]
Sumber rujukan untuk korpus yang dimuat dalam MALINDO Conc
MALINDO Concに搭載されているコーパスに対する引用文献
- Versi reklasifikasi Koleksi Korpus Leipzig:
Nomoto, Hiroki, Shiro Akasegawa dan Asako Shiohara. 2018. Reclassification of the Leipzig Corpora Collection for Malay and Indonesian. NUSA: Linguistic Studies of Languages in and around Indonesia 65: 47-66.
yang berdasarkan Koleksi Korpus Leipzig:
Goldhahn, Dirk, Thomas Eckart dan Uwe Quasthoff. 2012. Building large monolingual dictionaries at the Leipzig Corpora Collection: From 100 to 200 languages. Dlm Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12).
- Cerita Katak Bahasa Indonesia:
Moeljadi, David. 2014. Usage of Indonesian possessive verbal predicates: A statistical analysis based on storytelling survey. Tokyo University Linguistic Papers 35: 155-176.
- Korpus Variasi Bahasa Melayu
Informasi ukuran data
データサイズ情報
Korpus | Subkorpus | Ayat/Kalimat | Token | Kata | Tanda baca |
Koleksi Korpus Leipzig | IND MXD2012 | 300,000 | 5,428,067 | 4,740,137 | 687,930 |
IND WEB2012 | 300,000 | 5,540,573 | 4,831,254 | 709,319 |
IND WKP2016 | 300,000 | 5,634,138 | 4,899,482 | 734,656 |
ZSM MXD2012 | 300,000 | 4,184,270 | 3,630,902 | 553,368 |
ZSM WEB2012 | 300,000 | 4,180,551 | 3,628,128 | 552,423 |
ZSM WKP2016 | 300,000 | 5,787,015 | 5,075,767 | 711,248 |
Korpus Cerita Kata Bahasa Indonesia | KTK LISAN | 413 | 17,915 | 14,144 | 3,771 |
KTK TULIS | 342 | 9,666 | 8,302 | 1,364 |
Korpus Variasi Bahasa Melayu | VAR STD-L | 374 | 5,960 | 5,340 | 620 |
VAR SABAH | 1,228 | 7,993 | 5,756 | 2,237 |
VAR SARAWAK | 1,123 | 9,976 | 8,251 | 1,725 |
VAR BRUNEI | 2,747 | 45,168 | 34,234 | 10,934 |
VAR JKT-L | 1,023 | 16,547 | 12,323 | 4,224 |
Dasar privasi/Rahasia pribadi
個人情報の取り扱いについて
MALINDO Conc menggunakan Google Analyitics untuk mendapat informasi tentang penggunaan MALINDO Conc seperti jumlah pengguna dan lokasi rangkaian/jaringan pengguna. Lihat https://marketingplatform.google.com/about/analytics/ untuk mengetahui bagaimana data peribadi/pribadi ditangani oleh Google Analytics.