URL http kameken clique jpNLP 2010 p 7

  • Slides: 42
Download presentation

講義のURL http: //kameken. clique. jp/NLP 2010/ p. 7 Copyright© 2010 School of Computer Science,

講義のURL http: //kameken. clique. jp/NLP 2010/ p. 7 Copyright© 2010 School of Computer Science, Tokyo University of Technology

それでは始めましょう! p. 8 Copyright© 2010 School of Computer Science, Tokyo University of Technology

それでは始めましょう! p. 8 Copyright© 2010 School of Computer Science, Tokyo University of Technology

自然言語 そもそも言語とは? – 人 言語 (artificial languages) ( 形式言語 (formal languages) ) – 自然言語

自然言語 そもそも言語とは? – 人 言語 (artificial languages) ( 形式言語 (formal languages) ) – 自然言語 (natural languages) p. 10 Copyright© 2010 School of Computer Science, Tokyo University of Technology

どれが人 言語? 自然言語? For the things we have to learn before we can do

どれが人 言語? 自然言語? For the things we have to learn before we can do them, we learn by doing them. public class Client { public static void main(String[] args){ Creator a = new Concrete. Creator. A(); a. an. Operation(); Creator b = new Concrete. Creator. B(); b. an. Operation(); } } 出典: http: //commons. wikimedia. org/wiki/File: Ros p. 11 etta_Stone. JPG Copyright© 2010 School of Computer Science, Tokyo University of Technology

関連授業:「プログラミングの原理と言語 」 人 言語の例 l Q: How many programming languages do you know? 人

関連授業:「プログラミングの原理と言語 」 人 言語の例 l Q: How many programming languages do you know? 人 言語 – 例:Programming languages l l l l Algol, Apl, Awk BASIC C, C++, C#, Cobol Eiffel Forth, Fortran, F# Haskell, Hyper. Talk Java, JCL l l l Lisp, Logo Modula-2, Miranda Oberon, Objective-C, Ocaml Pascal, Perl, PHP, PL/I, Prolog, Python Ratfor, Ruby Simula, Snobol etc. p. 12 Copyright© 2010 School of Computer Science, Tokyo University of Technology

参考情報 l “A History of the History of Programming Languages, ” Thomas J. (Tim)

参考情報 l “A History of the History of Programming Languages, ” Thomas J. (Tim) Bergin, Communications of the ACM, Vol. 50 No. 5, Pages 69 -74(2007). "If I have seen further it is by standing on the shoulders of giants. "—Isaac Newton, in a letter to Robert Hooke, Feb. 15 (1676). p. 13 Copyright© 2010 School of Computer Science, Tokyo University of Technology

自然言語(形態の多様性) l 自然言語 – 文字言語 (written languages) 書き言葉 – 音声言語 (spoken languages) 話し言葉 –

自然言語(形態の多様性) l 自然言語 – 文字言語 (written languages) 書き言葉 – 音声言語 (spoken languages) 話し言葉 – 視覚言語 (visual languages) 手話 (sign languages), Icons p. 16 Copyright© 2010 School of Computer Science, Tokyo University of Technology

文字言語(3) Sous le pont Mirabeau coule la Seine, Et nos amour faut-il qu’il m’en

文字言語(3) Sous le pont Mirabeau coule la Seine, Et nos amour faut-il qu’il m’en souvient, La joie venait tousjour après la pein. (「ミラボー橋の下をセーヌは流れ」より) p. 19 Copyright© 2010 School of Computer Science, Tokyo University of Technology

文字言語(4) Es war einmal ein König in Thule Gar treu bis an das Grab,

文字言語(4) Es war einmal ein König in Thule Gar treu bis an das Grab, Dem sterbend seine Buhle Einen goldnen Becher gab. (「Faust」より) p. 20 Copyright© 2010 School of Computer Science, Tokyo University of Technology

文字言語(5) Habe nun, ach! Philosophie, Juristerei und Medizin, Und leider auch Theologie! Durchaus studiert,

文字言語(5) Habe nun, ach! Philosophie, Juristerei und Medizin, Und leider auch Theologie! Durchaus studiert, mit heißem Bemühn. Da steh ich nun, ich armer Tor! Und bin so klug als wie zuvor; Heiße Magister, heiße Doktor gar, Und ziehe schon an die zehen Jahr Herauf, herab und quer und krumm Meine Schüler an der Nase herum Und sehe, daß wir nichts wissen können! Das will mir schier das Herz verbrennen. Faustより p. 21 Copyright© 2010 School of Computer Science, Tokyo University of Technology

文字言語(6) l Δεν ελπίζω τίποτα. Δε φοβάμαι τίποτα. Είμαι λέφτερος. ( I hope for

文字言語(6) l Δεν ελπίζω τίποτα. Δε φοβάμαι τίποτα. Είμαι λέφτερος. ( I hope for nothing. I fear nothing. I am free. ) 出典: http: //en. wikipedia. org/wiki/Nikos_Kazantzakis p. 22 Copyright© 2010 School of Computer Science, Tokyo University of Technology

(おまけ)トンパ文字 出典: Wikipedia トンパ文字 http: //ja. wikipedia. org/wiki/ p. 24 Copyright© 2010 School of

(おまけ)トンパ文字 出典: Wikipedia トンパ文字 http: //ja. wikipedia. org/wiki/ p. 24 Copyright© 2010 School of Computer Science, Tokyo University of Technology

音声言語 Khoegowab (ナミビア語?) l http: //www. youtube. com/watch? v=Nz 44 W i. TVJww l

音声言語 Khoegowab (ナミビア語?) l http: //www. youtube. com/watch? v=Nz 44 W i. TVJww l http: //www. edsnet. na/Resources/african_la nguages/Khoekhoegowab. htm p. 25 Copyright© 2010 School of Computer Science, Tokyo University of Technology

視覚言語 手話学習支援システム (http: //www. teu. ac. jp/kmdit/JSL/) l NHKみんなの手話 (http: //www. nhk. or. jp/fukushi/min_syuwa/)

視覚言語 手話学習支援システム (http: //www. teu. ac. jp/kmdit/JSL/) l NHKみんなの手話 (http: //www. nhk. or. jp/fukushi/min_syuwa/) l 東京 科大学 ( http: //www. teu. ac. jp/kmdit/JSL/ ) l p. 26 Copyright© 2010 School of Computer Science, Tokyo University of Technology

処理対象 l 以下は主として、文字言語とする。 (「テキスト処理」ということ。) p. 27 Copyright© 2010 School of Computer Science, Tokyo University

処理対象 l 以下は主として、文字言語とする。 (「テキスト処理」ということ。) p. 27 Copyright© 2010 School of Computer Science, Tokyo University of Technology

l (自然言語)処理 文章 理解 内部表現 p. 30 Copyright© 2010 School of Computer Science, Tokyo

l (自然言語)処理 文章 理解 内部表現 p. 30 Copyright© 2010 School of Computer Science, Tokyo University of Technology

l (自然言語)処理 文章 生成 内部表現 p. 31 Copyright© 2010 School of Computer Science, Tokyo

l (自然言語)処理 文章 生成 内部表現 p. 31 Copyright© 2010 School of Computer Science, Tokyo University of Technology

l (自然言語)処理 言語表現 理解 & 生成 内部表現 p. 32 Copyright© 2010 School of Computer

l (自然言語)処理 言語表現 理解 & 生成 内部表現 p. 32 Copyright© 2010 School of Computer Science, Tokyo University of Technology

自然言語処理 => 自然言語を処理する => テキストを理解・生成する 誰が? p. 33 Copyright© 2010 School of Computer Science,

自然言語処理 => 自然言語を処理する => テキストを理解・生成する 誰が? p. 33 Copyright© 2010 School of Computer Science, Tokyo University of Technology

人間における言語処理 vs 機械における言語処理 p. 34 Copyright© 2010 School of Computer Science, Tokyo University of

人間における言語処理 vs 機械における言語処理 p. 34 Copyright© 2010 School of Computer Science, Tokyo University of Technology

p. 36 Copyright© 2010 School of Computer Science, Tokyo University of Technology

p. 36 Copyright© 2010 School of Computer Science, Tokyo University of Technology

NLP関連のソフトウェア open. NLP http: //opennlp. sourceforge. net/ ) l Swi-Prolog ( http: //www. swi-prolog.

NLP関連のソフトウェア open. NLP http: //opennlp. sourceforge. net/ ) l Swi-Prolog ( http: //www. swi-prolog. org/ ) のNLP関連ツール など l p. 40 Copyright© 2010 School of Computer Science, Tokyo University of Technology

それではこのようなプログラムの 原理を理解し、自分でも作れるよ うにがんばりましょう! p. 41 Copyright© 2010 School of Computer Science, Tokyo University of

それではこのようなプログラムの 原理を理解し、自分でも作れるよ うにがんばりましょう! p. 41 Copyright© 2010 School of Computer Science, Tokyo University of Technology

出典等の情報 1. ロゼッタストーン 2. 3. ACM Digital Library 大阪府吹田市緑化公園室公園えとせとら 4. カンザキスの言葉 http: //commons. wikimedia.

出典等の情報 1. ロゼッタストーン 2. 3. ACM Digital Library 大阪府吹田市緑化公園室公園えとせとら 4. カンザキスの言葉 http: //commons. wikimedia. org/wiki/File: Rosetta_Stone. JPGhttp: //www. ethn ologue. com/ http: //www. city. suita. osaka. jp/home/soshiki/divkensetsuryokka/ryokkakoue n. html http: //en. wikipedia. org/wiki/Nikos_Kazantzakis p. 42 Copyright© 2010 School of Computer Science, Tokyo University of Technology