2014 Natural Language Processing 2014 url kameken clique

  • Slides: 47
Download presentation
自然言語処理2014 Natural Language Processing 2014 url: kameken. clique. jp/Lectures 2014/NLP 2014/ 平成 26年度後期 東京

自然言語処理2014 Natural Language Processing 2014 url: kameken. clique. jp/Lectures 2014/NLP 2014/ 平成 26年度後期 東京 科大学CS学部 担当:亀田弘之

今日の学習目標 1. 2. 講義概要を説明できる。 本講義で得られる知識・スキル・ コンピテンシを知る。 p. 2 Copyright© 2014 School of Computer Science,

今日の学習目標 1. 2. 講義概要を説明できる。 本講義で得られる知識・スキル・ コンピテンシを知る。 p. 2 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

CSの学生に必要なコンピテンシの一覧 (注)教科書「教えないPBL」(仮称)より,神沼 他 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda) p. 3

CSの学生に必要なコンピテンシの一覧 (注)教科書「教えないPBL」(仮称)より,神沼 他 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda) p. 3

講義のURL http: //kameken. clique. jp/Lectures/ Lectures 2014/NLP 2014/ p. 9 Copyright© 2014 School of

講義のURL http: //kameken. clique. jp/Lectures/ Lectures 2014/NLP 2014/ p. 9 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

それでは始めましょう! p. 10 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

それでは始めましょう! p. 10 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

自然言語 そもそも言語とは? – 人 言語 (artificial languages) ( 形式言語 (formal languages) ) – 自然言語

自然言語 そもそも言語とは? – 人 言語 (artificial languages) ( 形式言語 (formal languages) ) – 自然言語 (natural languages) コメント: 実態は多様性に溢れている。 p. 12 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

どれが人 言語? 自然言語? For the things we have to learn before we can do them,

どれが人 言語? 自然言語? For the things we have to learn before we can do them, we learn by doing them. quick. Sort [x] = [] q. Sort x: xs = q. Sort smaller ++ [x] ++ q. Sort larger where smaller = [ a | a <- xs, a <= x ] larger = [ a | a , - xs, a > x ] public class Client { public static void main(String[] args){ Creator a = new Concrete. Creator. A(); a. an. Operation(); Creator b = new Concrete. Creator. B(); b. an. Operation(); } } 出典: http: //commons. wikimedia. org/wiki/File: Ros p. 13 etta_Stone. JPG Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

関連授業:「プログラミングの原理と言語 」 人 言語の例 l 人 言語 Q: How many programming languages do you

関連授業:「プログラミングの原理と言語 」 人 言語の例 l 人 言語 Q: How many programming languages do you know? – 例:Programming languages l l l l Algol, Apl, Awk BASIC C, C++, C#, Cobol Eiffel Forth, Fortran, F# Haskell, Hyper. Talk Java, JCL l l l Lisp, Logo Modula-2, Miranda Oberon, Objective-C, Ocaml Pascal, Perl, PHP, PL/I, Prolog, Python Ratfor, Ruby Simula, Snobol etc. p. 14 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

参考情報 l “A History of the History of Programming Languages, ” Thomas J. (Tim)

参考情報 l “A History of the History of Programming Languages, ” Thomas J. (Tim) Bergin, Communications of the ACM, Vol. 50 No. 5, Pages 69 -74(2007). "If I have seen further it is by standing on the shoulders of giants. "—Isaac Newton, in a letter to Robert Hooke, Feb. 15 (1676). p. 15 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

自然言語(形態の多様性) l 自然言語 – 文字言語 (written languages) 書き言葉 – 音声言語 (spoken languages) 話し言葉 –

自然言語(形態の多様性) l 自然言語 – 文字言語 (written languages) 書き言葉 – 音声言語 (spoken languages) 話し言葉 – 視覚言語 (visual languages) 手話 (sign languages), Icons p. 18 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

文字言語(3) Sous le pont Mirabeau coule la Seine, Et nos amour faut-il qu’il m’en

文字言語(3) Sous le pont Mirabeau coule la Seine, Et nos amour faut-il qu’il m’en souvient, La joie venait tousjour après la pein. (「ミラボー橋の下をセーヌは流れ」より) p. 21 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

文字言語(4) Es war einmal ein König in Thule Gar treu bis an das Grab,

文字言語(4) Es war einmal ein König in Thule Gar treu bis an das Grab, Dem sterbend seine Buhle Einen goldnen Becher gab.      (Goethe 「Faust」より) p. 22 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

文字言語(5) Habe nun, ach! Philosophie, Juristerei und Medizin, Und leider auch Theologie! Durchaus studiert,

文字言語(5) Habe nun, ach! Philosophie, Juristerei und Medizin, Und leider auch Theologie! Durchaus studiert, mit heißem Bemühn. Da steh ich nun, ich armer Tor! Und bin so klug als wie zuvor; Heiße Magister, heiße Doktor gar, Und ziehe schon an die zehen Jahr Herauf, herab und quer und krumm Meine Schüler an der Nase herum Und sehe, daß wir nichts wissen können! Das will mir schier das Herz verbrennen.     Faustより p. 23 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

文字言語(6) l Δεν ελπίζω τίποτα. Δε φοβάμαι τίποτα. Είμαι λέφτερος. ( I hope for

文字言語(6) l Δεν ελπίζω τίποτα. Δε φοβάμαι τίποτα. Είμαι λέφτερος. ( I hope for nothing. I fear nothing. I am free. ) 出典: http: //en. wikipedia. org/wiki/Nikos_Kazantzakis p. 24 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

(おまけ)トンパ文字 出典: Wikipedia トンパ文字 http: //ja. wikipedia. org/wiki/ p. 26 Copyright© 2014 School of

(おまけ)トンパ文字 出典: Wikipedia トンパ文字 http: //ja. wikipedia. org/wiki/ p. 26 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

音声言語 Khoegowab (ナミビア語?) l http: //www. youtube. com/watch? v=Nz 44 W i. TVJww l http:

音声言語 Khoegowab (ナミビア語?) l http: //www. youtube. com/watch? v=Nz 44 W i. TVJww l http: //www. edsnet. na/Resources/african_la nguages/Khoekhoegowab. htm <=無くな った? p. 27 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

視覚言語 手話学習支援システム (東京 科大学) (http: //www 2. teu. ac. jp/kmdit/JSL/) l NHKみんなの手話 (http: //www.

視覚言語 手話学習支援システム (東京 科大学) (http: //www 2. teu. ac. jp/kmdit/JSL/) l NHKみんなの手話 (http: //www. nhk. or. jp/fukushi/min_syuwa/) l p. 28 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

処理対象 l 以下は主として、文字言語とする。 (「テキスト処理」ということ。) p. 29 Copyright© 2014 School of Computer Science, Tokyo University

処理対象 l 以下は主として、文字言語とする。 (「テキスト処理」ということ。) p. 29 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

l (自然言語)処理 文章 理解 内部表現 p. 32 Copyright© 2014 School of Computer Science, Tokyo

l (自然言語)処理 文章 理解 内部表現 p. 32 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

l (自然言語)処理 文章 生成 内部表現 p. 33 Copyright© 2014 School of Computer Science, Tokyo

l (自然言語)処理 文章 生成 内部表現 p. 33 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

l (自然言語)処理 言語表現 理解 & 生成 内部表現 p. 34 Copyright© 2014 School of Computer

l (自然言語)処理 言語表現 理解 & 生成 内部表現 p. 34 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

自然言語処理 => 自然言語を処理する => テキストを理解・生成する 誰が? p. 35 Copyright© 2014 School of Computer Science, Tokyo University

自然言語処理 => 自然言語を処理する => テキストを理解・生成する 誰が? p. 35 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

人間における言語処理 vs 機械における言語処理 p. 36 Copyright© 2014 School of Computer Science, Tokyo University of

人間における言語処理 vs 機械における言語処理 p. 36 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

人間における言語処理 vs 機械における言語処理 認知心理学・ 脳神経科学 人 知能(AI)・ 自然言語処理 (NLP) p. 37 Copyright© 2014 School

人間における言語処理 vs 機械における言語処理 認知心理学・ 脳神経科学 人 知能(AI)・ 自然言語処理 (NLP) p. 37 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

NLP関連のソフトウェア open. NLP http: //opennlp. sourceforge. net/ ) l Swi-Prolog ( http: //www. swi-prolog. org/

NLP関連のソフトウェア open. NLP http: //opennlp. sourceforge. net/ ) l Swi-Prolog ( http: //www. swi-prolog. org/ ) のNLP関連ツール など l p. 42 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

それではこのようなプログラムの 原理を理解し、自分でも作れるよ うにがんばりましょう! p. 43 Copyright© 2014 School of Computer Science, Tokyo University of

それではこのようなプログラムの 原理を理解し、自分でも作れるよ うにがんばりましょう! p. 43 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

参考(続き) 本講義では今年度は,Virtual Personal Assistant (chatbot) の話題も取り上げる。 l AIML(Artificial Intelligence Markup Language)や Pandora. Bot についても言及

参考(続き) 本講義では今年度は,Virtual Personal Assistant (chatbot) の話題も取り上げる。 l AIML(Artificial Intelligence Markup Language)や Pandora. Bot についても言及 する。 l 参考文献: l – M. F. Mc. Tear and Z. Callejas, Voice Application Development for Android, PACKT(2013). p. 45 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)

出典等の情報 1. ロゼッタストーン 2. 3. ACM Digital Library 大阪府吹田市緑化公園室公園えとせとら 4. カンザキスの言葉 http: //commons. wikimedia.

出典等の情報 1. ロゼッタストーン 2. 3. ACM Digital Library 大阪府吹田市緑化公園室公園えとせとら 4. カンザキスの言葉 http: //commons. wikimedia. org/wiki/File: Rosetta_Stone. JPGhttp: //www. ethn ologue. com/ http: //www. city. suita. osaka. jp/home/soshiki/divkensetsuryokka/ryokkakoue n. html http: //en. wikipedia. org/wiki/Nikos_Kazantzakis p. 46 Copyright© 2014 School of Computer Science, Tokyo University of Technology(Kameda)