日本語概要

このページではマレー語・インドネシア語の2つのデジタル言語資源についてユーザーのために情報を提供しています。

  1. 形態情報辞書 MALINDO Morph
  2. コーパス検索システム MALINDO Conc
いずれも日本学術振興会の「頭脳循環を加速する戦略的国際研究ネットワーク推進プログラム」による東京外国語大学ナンヤン工科大学の共同研究を通じて開発されました。事業終了後も、日本学術振興会の「国際的な活躍が期待できる研究者の育成事業」、科学研究費補助金(課題番号26770135, 18K00568)、東京外国語大学アジア・アフリカ言語文化研究所情報資源利用研究センターからの助成のおかげで、新規データの追加、既存データの改訂、システムの改良および保守を継続できています。

東京外国語大学アジア・アフリカ言語文化研究所情報資源利用研究センターのプロジェクト関連部分に関する詳細はこちら

MALINDO Morph | MALINDO Conc

MALINDO: Sumber bahasa digital untuk bahasa Melayu/Indonesia MALINDO: マレー語・インドネシア語のためのデジタル言語資源

Sumber bahasa digital MALINDO Morph dan MALINDO Conc adalah hasil kolaborasi di antara Universiti Bahasa Asing Tokyo/Universititas Kajian Asing Tokyo dan Universiti Teknologi Nanyang/Universitas Teknologi Nanyang, Singapura.

MALINDO Morph (kamus morfologi) MALINDO Morph (形態情報辞書)

Sumber rujukan 引用文献

Nomoto, Hiroki, Hannah Choi, David Moeljadi dan Francis Bond. 2018. MALINDO Morph: Morphological dictionary and analyser for Malay/Indonesian. Kiyoaki Shirai (peny.) Proceedings of the LREC 2018 Workshop "The 13th Workshop on Asian Language Resources", 36-43.

MALINDO Conc (sistem pencarian korpus) MALINDO Conc (コーパス検索システム)

Panduan Pengguna/Petunjuk Penggunaan ユーザーガイド

Sumber rujukan untuk sistem MALINDO Conc sendiri MALINDO Concそのものに対する引用文献

Nomoto, Hiroki, Shiro Akasegawa dan Asako Shiohara. 2018. Building an open online concordancer for Malay/Indonesian. The 22nd International Symposium on Malay/Indonesian Linguistics (ISMIL). 11-12 Mei. Universiti California, Los Angeles, AS. [slaid]

Sumber rujukan untuk korpus yang dimuat dalam MALINDO Conc MALINDO Concに搭載されているコーパスに対する引用文献

  1. Versi reklasifikasi Koleksi Korpus Leipzig:
    Nomoto, Hiroki, Shiro Akasegawa dan Asako Shiohara. 2018. Reclassification of the Leipzig Corpora Collection for Malay and Indonesian. NUSA: Linguistic Studies of Languages in and around Indonesia 65: 47-66.
    yang berdasarkan Koleksi Korpus Leipzig:
    Goldhahn, Dirk, Thomas Eckart dan Uwe Quasthoff. 2012. Building large monolingual dictionaries at the Leipzig Corpora Collection: From 100 to 200 languages. Dlm Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12).
  2. Cerita Katak Bahasa Indonesia:
    Moeljadi, David. 2014. Usage of Indonesian possessive verbal predicates: A statistical analysis based on storytelling survey. Tokyo University Linguistic Papers 35: 155-176.
  3. Korpus Variasi Bahasa Melayu

Informasi ukuran data データサイズ情報

KorpusSubkorpusAyat/KalimatTokenKataTanda baca
Koleksi Korpus LeipzigIND MXD2012300,0005,428,0674,740,137687,930
IND WEB2012300,0005,540,5734,831,254709,319
IND WKP2016300,0005,634,1384,899,482734,656
ZSM MXD2012300,0004,184,2703,630,902553,368
ZSM WEB2012300,0004,180,5513,628,128552,423
ZSM WKP2016300,0005,787,0155,075,767711,248
Korpus Cerita Kata Bahasa IndonesiaKTK LISAN41317,91514,1443,771
KTK TULIS3429,6668,3021,364
Korpus Variasi Bahasa MelayuVAR STD-L3745,9605,340620
VAR SABAH1,2287,9935,7562,237
VAR SARAWAK1,1239,9768,2511,725
VAR BRUNEI2,74745,16834,23410,934
VAR JKT-L1,02316,54712,3234,224

Dasar privasi/Rahasia pribadi 個人情報の取り扱いについて

MALINDO Conc menggunakan Google Analyitics untuk mendapat informasi tentang penggunaan MALINDO Conc seperti jumlah pengguna dan lokasi rangkaian/jaringan pengguna. Lihat https://marketingplatform.google.com/about/analytics/ untuk mengetahui bagaimana data peribadi/pribadi ditangani oleh Google Analytics.