Pertemuan ke5 CSH 4 H 3 Text Mining

  • Slides: 92
Download presentation
Pertemuan ke-5 CSH 4 H 3 Text Mining Semester: 2018 -1 Dasar Linguistik dan

Pertemuan ke-5 CSH 4 H 3 Text Mining Semester: 2018 -1 Dasar Linguistik dan NLP Moch Arif Bijaksana Utamanya dari buku: Abdul Chaer “Linguistik Umum” 1

Outline • • • Linguistik dan Bahasa Tataran Linguistik (1): Fonologi Tataran Linguistik (2):

Outline • • • Linguistik dan Bahasa Tataran Linguistik (1): Fonologi Tataran Linguistik (2): Morfologi Tataran Linguistik (3): Sintaksis Tataran Linguistik (4): Semantik 2

Outline • • • Linguistik dan Bahasa Tataran Linguistik (1): Fonologi Tataran Linguistik (2):

Outline • • • Linguistik dan Bahasa Tataran Linguistik (1): Fonologi Tataran Linguistik (2): Morfologi Tataran Linguistik (3): Sintaksis Tataran Linguistik (4): Semantik 3

4

4

 • Contoh, digunakan unt feature. Dari: (Shehata et. al, 2007) 5

• Contoh, digunakan unt feature. Dari: (Shehata et. al, 2007) 5

Linguistik dan Bahasa • Linguistik: ilmu dengan obyek penelitian adalah bahasa. • Linguistik Umum:

Linguistik dan Bahasa • Linguistik: ilmu dengan obyek penelitian adalah bahasa. • Linguistik Umum: obyek bahasa scr umum (bukan bahasa tertentu). • Bahasa adalah bunyi ujaran. Bahasa lisan adalah yg primer, bhs tulis sekunder. • Setiap bahasa bersifat unik, shg linguistik tdk berusaha menggunakan kerangka suatu bahasa unt dikenakan pada bhs lain. 6

Linguistik dan Bahasa (cont) • Bahasa adalah sistem (sistemik), kumpulan unsur yg yg saling

Linguistik dan Bahasa (cont) • Bahasa adalah sistem (sistemik), kumpulan unsur yg yg saling terkait. Disebut pendekatan struktural. • Bahasa itu dinamis, dapat berubah dari waktu ke waktu. • Bahasa itu bersifat empirik, maka linguistik mendekati bahasa scr deskriptif, tidak scr preskriptif. – Deskriptif: apa yg diungkapkan oleh orang/masyarakat (sebagai data empirik). – Preskriptif: apa yang seharusnya menurut peneliti. 7

Linguistik dan Bahasa • Sikap preskriptif – Yang benar kata silakan, bukan silahkan. –

Linguistik dan Bahasa • Sikap preskriptif – Yang benar kata silakan, bukan silahkan. – Yang baku adalah bentuk kata mengubah, bukan merubah atau merobah. • Sikap deskriptif – Kata silahkan dipakai bersama dengan kata silakan. – Bentuk kata merubah dan merobah biasa dipakai di samping kata mengubah. 8

Linguistik • Salah satu subdisplin linguistik adalah linguistik mikro, yg kajiannya pada struktur internal

Linguistik • Salah satu subdisplin linguistik adalah linguistik mikro, yg kajiannya pada struktur internal bahasa. • Linguistik mikro dianggap inti dari linguistik. • Sejalan dengan subsistem bahasa, dlm linguistik mikro ada subdisiplin linguistik: – Fonologi – Morfologi – Sintaksis – Semantik – Leksikologi 9

Linguistik (cont) • Fonologi: menyelidiki ciri 2 bunyi bahasa, cara terjadinya, dan fungsinya dalam

Linguistik (cont) • Fonologi: menyelidiki ciri 2 bunyi bahasa, cara terjadinya, dan fungsinya dalam sistem kebahasaan secara keseluruhan. • Morfologi: menyelidiki struktur kata, bagian 2 nya, serta cara pembentukannya. • Sintaksis: menyelidiki satuan 2 kata dan satuan 2 lain di atas kata, hubungan satu dengan lainnya, serta cara penyusunannya sehingga menjadi satuan ujaran. • Gramatika atau tata bahasa: istilah tadisional unt gabungan morfologi dan sintaksis. 10

Linguistik (cont) • Semantik: menyelidiki makna bahasa, baik yg bersifat leksikal, gramatikal maupun kontekstual.

Linguistik (cont) • Semantik: menyelidiki makna bahasa, baik yg bersifat leksikal, gramatikal maupun kontekstual. • Leksikologi: menyelidiki leksikon atau kosa kata suatu bahasa dari berbagai aspeknya. • Pragmatik: menyelidiki penggunaan bahasa dg berbagai aspeknya, sebagai sarana komunikasi verbal bagi manusia. • Fonologi, morfologi, sintaksis tersusun secara hirarki; ketiganya terkait dengan semantik, sedangkan leksikon juga diliputi semantik. 11

Analisis Linguistik: Struktur, Sistem dan Distribusi • Dua jenis relasi antara satuan 2 bahasa:

Analisis Linguistik: Struktur, Sistem dan Distribusi • Dua jenis relasi antara satuan 2 bahasa: relasi sintagmatik dan relasi paradigmatik (asosiatif) 12

Analisis Linguistik: Struktur, Sistem dan Distribusi (cont) • Relasi sintagmatik => struktur • Relasi

Analisis Linguistik: Struktur, Sistem dan Distribusi (cont) • Relasi sintagmatik => struktur • Relasi paradigmatik => sistem • Istilah struktur dan sistem dianggap lbh tepat krn dapat digunakan pada semua tataran bhs (yi. fonetik, morfologi, sintaksis dan leksikon). • Sistem pada dasarnya menyangkut distribusi. • Distribusi: menyangkut masalah dapat atau tidaknya penggantian suatu konstituen tertentu dalam kalimat dengan konstituen lain. – Konstituen: unsur, bawahan; unsur bahasa yang merupakan bagian dari satuan yang lebih besar [KBBI]. 13

Analisis Linguistik: Struktur, Sistem dan Distribusi (cont) • Contoh, pada kalimat Dia mengikut ibunya.

Analisis Linguistik: Struktur, Sistem dan Distribusi (cont) • Contoh, pada kalimat Dia mengikut ibunya. – Konstituen dia dapat diganti atau disubstitusikan dengan konstituen Ali, anak itu, atau mahasiswa itu; tetapi tidak bisa diganti dengan konstituen berlari, marah, atau meja itu. – Konstituen mengikut dapat diganti dengan konstituen menyapa, membawa, atau mengunjungi; tetapi tidak dapat diganti dengan konstituen orang itu, sering, atau tetapi. 14

Analisis Linguistik: Analisis Bawahan Langsung • Analisis Bawahan Langsung (Immediate Constituent Analysis). • Teknik

Analisis Linguistik: Analisis Bawahan Langsung • Analisis Bawahan Langsung (Immediate Constituent Analysis). • Teknik dlm menganalisis unsur 2 atau konstituen 2 yg membangun suatu satuan bahasa (misal. kata, frase, klausa, kalimat). • Biasanya setiap satuan bhs terdiri dari dua konstituen. 15

Analisis Linguistik: Analisis Bawahan Langsung (cont) • Unt yg terdiri dari 3 konstituen •

Analisis Linguistik: Analisis Bawahan Langsung (cont) • Unt yg terdiri dari 3 konstituen • Antara lain bisa menghilangkan ambiguitas. 16

Analisis Linguistik: Analisis Rangkaian dan Proses Unsur • Terbatas pada satuan morfologi. • Setiap

Analisis Linguistik: Analisis Rangkaian dan Proses Unsur • Terbatas pada satuan morfologi. • Setiap satuan bahasa dibentuk dari unsur 2 lain. – Misal: satuan • tertimbun, terdiri dari ter- + timbun. 17

Bahasa • Bahasa adalah sistem bunyi yang arbitrer yg digunakan oleh para anggota kelompok

Bahasa • Bahasa adalah sistem bunyi yang arbitrer yg digunakan oleh para anggota kelompok sosial unt bekerja sama, berkomunikasi dan mengidentifikasikan diri. • Bahasa sebagai sebuah sistem. – Sistematis: bahasa tersusun menurut suatu pola; tidak tersusun secara acak, secara sembarangan. – Sistemik: bukan merupakan sistem tunggal, namun terdiri dari subsistem, al. subsistem 2 fonologi, morfologi, sintaksis, dan semantik. 18

 • Fon: satuan bunyi yg dihasilkan oleh alat ucap manusia. • Fonem: satuan

• Fon: satuan bunyi yg dihasilkan oleh alat ucap manusia. • Fonem: satuan bunyi terkecil yang mampu menunjukkan kontras makna, misalnya /h/ adalah fonem karena membedakan makna kata harus dan arus, /b/ dan /p/ adalah dua fonem yang berbeda karena bara dan para berbeda maknanya. • Morfem: satuan bentuk bahasa terkecil yg mempunyai makna secara relatif stabil dan tdk dpt dibagi atas bagian bermakna 19 yang lebih kecil.

 • Kata, frase, klausa, kalimat, wacana 20

• Kata, frase, klausa, kalimat, wacana 20

Bahasa (cont) • Bahasa sebagai lambang/simbol. – Ilmu semiotika: mempelajari tanda-tanda yg ada dlm

Bahasa (cont) • Bahasa sebagai lambang/simbol. – Ilmu semiotika: mempelajari tanda-tanda yg ada dlm kehidupan manusia termasuk bahasa. – Bisa dibedakan tanda (sign) dan lambang (simbol) 21

Bahasa (cont) • Tanda / sign: ada kaitan 22

Bahasa (cont) • Tanda / sign: ada kaitan 22

Bahasa (cont) • Lambang / simbol: tdk ada kaitan bersifat langsung atau alamiah. 23

Bahasa (cont) • Lambang / simbol: tdk ada kaitan bersifat langsung atau alamiah. 23

Bahasa (cont) • [kuda], [horse], [ ] ﺣﺼﺎﻥ 24

Bahasa (cont) • [kuda], [horse], [ ] ﺣﺼﺎﻥ 24

Bahasa (cont) • Bahasa utamanya adalah bahasa lisan. Rekaman bahasa tulis, ada bbrp unsur

Bahasa (cont) • Bahasa utamanya adalah bahasa lisan. Rekaman bahasa tulis, ada bbrp unsur bahasa lisan yg tidak terekam spt intonasi dan nada. 25

Tataran Linguistik (1): Fonologi • Fonologi: menyelidiki ciri 2 bunyi bahasa, cara terjadinya, dan

Tataran Linguistik (1): Fonologi • Fonologi: menyelidiki ciri 2 bunyi bahasa, cara terjadinya, dan fungsinya dalam sistem kebahasaan secara keseluruhan 26

Fonologi (cont) • Tulisan fonetik Contoh unt British What country are you from? wɒt

Fonologi (cont) • Tulisan fonetik Contoh unt British What country are you from? wɒt ˈkʌntri ɑː juː frɒm? I am from Indonesia. aɪ æm frɒm ˌɪndəˈnɪzɪə. 27

Tataran Linguistik (2): Morfologi • Morfologi: menyelidiki struktur kata, bagian 2 nya, serta cara

Tataran Linguistik (2): Morfologi • Morfologi: menyelidiki struktur kata, bagian 2 nya, serta cara pembentukannya. • Morfem: satuan bentuk bahasa terkecil yang mempunyai makna secara relatif stabil dan tidak dapat dibagi atas bagian bermakna yang lebih kecil. 28

Morfologi: Morfem • Biasanya ditandai dengan kurung kurawal. • Contoh kata kedua terdiri dari

Morfologi: Morfem • Biasanya ditandai dengan kurung kurawal. • Contoh kata kedua terdiri dari dua morfem {ke} + {dua} 29

Morfologi (cont) • Ada 3 jenis utama proses morfologi – Inflection, misalpenambahan prefix atau

Morfologi (cont) • Ada 3 jenis utama proses morfologi – Inflection, misalpenambahan prefix atau suffix. Misalnya unt singular – plural. – Derivation – Compounding • Unt inflection: bentuk 2 inflection dari sebuah kata dikelompokkan dlm sebuah grup lexeme yg sama. 30

Morfologi (cont) • Derivation: perubahannya lbh mendasar/banyak. Contoh dari wide (adjective) menjadi widely (adverb).

Morfologi (cont) • Derivation: perubahannya lbh mendasar/banyak. Contoh dari wide (adjective) menjadi widely (adverb). • Compounding: penggabungan dua atau lebih kata menjadi satu kata baru. Contoh: disk drive. Meskipun ditulis dalam dua kata, namun sebenarnya sebagai satu kata tunggal. 31

Morfologi: Kata • Jenis kata (POS Part of Speech). • Tiga jenis POS utama:

Morfologi: Kata • Jenis kata (POS Part of Speech). • Tiga jenis POS utama: – Noun (nomina atau kata benda). – Verb (verba atau kata kerja). – Ajective (adjektiva atau kata sifat). 32

Kata (cont) • Sebuah kata bisa mempunyai lbh dari satu POS yg berbeda, contoh

Kata (cont) • Sebuah kata bisa mempunyai lbh dari satu POS yg berbeda, contoh kata “candy”. 33

Kata (cont) • Kelas kata bisa dibagi 2: – Kategori terbuka atau leksikal, seperti

Kata (cont) • Kelas kata bisa dibagi 2: – Kategori terbuka atau leksikal, seperti unt noun, verb, adjective, yg mempunyai jml anggota yang banyak. – Kategori tertutup atau fungsional, seperti preposition dan determiner (misal kata of, on, the, a) , yg jml anggotanya sedikit dan umumnya mempunyai penggunaan gramatical yg jelas. 34

Kata (cont) • Kode atau singkatan tag bagi POS yg populer al dari Brown

Kata (cont) • Kode atau singkatan tag bagi POS yg populer al dari Brown Corpus. • Scr tradisional ada 8 POS, yaitu noun, verb, adjective, adverb, pronoun, preposition, conjunction, dan interjection. • Morfologi terutama lebih diperlukan unt bahasa yang mempunyai tingkat infleksi yang tinggi. – Infleksi yaitu variasi atau perubahan sebuah kata dari akar kata (kata dasar)nya. 35

POS Penn Treebank 36

POS Penn Treebank 36

POS: Noun dan Pronoun • Noun dan pronoun. – Noun umumnya mengacu pada entitas,

POS: Noun dan Pronoun • Noun dan pronoun. – Noun umumnya mengacu pada entitas, seperti orang, binatang, benda. Contoh anjing, pohon, orang, topi, pidato, ide, filosofi. – Infleksi pada noun, al jumlah: tunggal-jamak (contoh dog – dogs). – Unt bhs Inggris (dan juga Bhs Indonesia) tdk ada infleksi krn gender. Unt bahas Arab ada. 37

POS: Noun dan Pronoun (cont) – Pada bbrp bhs bentuk noun juga berbeda unt

POS: Noun dan Pronoun (cont) – Pada bbrp bhs bentuk noun juga berbeda unt fungsi yg berbeda (subyek, obyek dst) dlm kalimat. Bentuk ini disebut cases. Contoh pada bahasa Latin unt son, adalah filius (unt subyek), dan filium (unt obyek). – Pronoun merupakan sebuah kelas kata yang kecil yg bertindak seperti variabel. – Pronoun dlm Bhs Inggris merupakan satu-satunya jenis kata yang bebeda bentuknya bila menjadi subyek dan obyek. Dlm bhs Inggris ada posesiv pronoun (misal mine) 38

POS: Noun dan Pronoun (cont) • Pada Word. Net, entri utama adalah noun. Jumlahnya

POS: Noun dan Pronoun (cont) • Pada Word. Net, entri utama adalah noun. Jumlahnya paling banyak, dan hanya noun yg mempunyai taksonomi lengkap. 39

POS: Determiner dan Adjective • Kata yg menyertai noun: determiner dan adjective. • Bbrp

POS: Determiner dan Adjective • Kata yg menyertai noun: determiner dan adjective. • Bbrp kata lain umumnya kata yang menyertai noun. – Determiner: menerangkan referensi utama sebuah noun. Salah satu jenis determiner adalah article (contoh a dan an). – Adjective: merangkan sifat dari sebuah noun (contoh: red rose). 40

POS: Verb • Verb digunakan unt menerangkan – aksi, contoh She threw the stone

POS: Verb • Verb digunakan unt menerangkan – aksi, contoh She threw the stone – Aktivitas, contoh She walked along the river – I have $50 • Ada bbrp bentuk morfologis unt Bhs Inggris, contoh – Bentuk akar kata atau dasar: walk – Third singular present tense: walks – Gerund dan present priciple: walking – Past tense dan past/passive participle: walked 41

Verb (cont) • tag unt verb: – VB, contoh take – VBD, took –

Verb (cont) • tag unt verb: – VB, contoh take – VBD, took – VBG, taking – VBN, taken – VBP, take – VBZ, takes 42

POS lain • Adverb (kata keterangan, adverbia), preposition(kata depan, preposisi), particle (partikel). • Adverb

POS lain • Adverb (kata keterangan, adverbia), preposition(kata depan, preposisi), particle (partikel). • Adverb menyertai verb, memberi keterangan verb yang disertainya. Contoh She often travels to Japan. She started her career off very impressively. • Banyak yang merupakan turunan dari adjective , ditambah akhiran –ly. 43

POS lain (cont) • Preposition utamanya adalah kata yang pendek yang menyatakan hubungan spasial.

POS lain (cont) • Preposition utamanya adalah kata yang pendek yang menyatakan hubungan spasial. Contoh in the glass, on the table, about an interesting idea, concerning your recent invention. • Particle adalah subclas dari preposisi yang bisa membentuk phrasal verb, contoh He put me off. 44

POS lain (cont) • POS lain: conjunction (kata hubung, konjungsi), yang menghubungkan atau mengkoordinasikan

POS lain (cont) • POS lain: conjunction (kata hubung, konjungsi), yang menghubungkan atau mengkoordinasikan antara dua kata yg biasanya mempunyai POS yg sama. Contoh – Husband wife. [nouns] – She bought or leased the car. [verbs] – the green traingle and the blue square [noun phrase] – She bought he car, but she also considering leasing it. [sentences] 45

Tataran Linguistik (3): Sintaksis • Sintaksis: menyelidiki satuan 2 kata dan satuan 2 lain

Tataran Linguistik (3): Sintaksis • Sintaksis: menyelidiki satuan 2 kata dan satuan 2 lain di atas kata, hubungan satu dengan lainnya, serta cara penyusunannya sehingga menjadi satuan ujaran. • Gramatika atau tata bahasa: istilah tadisional unt gabungan morfologi dan sintaksis. 46

Sintaksis (cont) • Struktur sintaksis – Fungsi sintaks: mis. subjek, predikat, objek – Kategori

Sintaksis (cont) • Struktur sintaksis – Fungsi sintaks: mis. subjek, predikat, objek – Kategori sintaks: mis. verba, nomina, adjective – Peran sintaks: mis. pelaku, penderita, penerima 47

Pelabelan Struktur Kalimat Bhs Indonesia INACL Isi diambil dari dokumen INACL. Outline • Frasa,

Pelabelan Struktur Kalimat Bhs Indonesia INACL Isi diambil dari dokumen INACL. Outline • Frasa, klausa, kalimat – Konsep Dasar – Bangun Struktur Kalimat • Daftar Label – Label Kategori Frasa – Label Penggabung Kata • Contoh Penerapan – – – Kalimat Tunggal Kalimat Koordinatif (Kalimat Majemuk Setara) Kalimat Subordinatif (Kalimat Majemuk Tak Setara) Kalimat Pertanyaan Kalimat Ber kata kerja Berderet 48

Pendahuluan • Syntax Parsing • Pelabelan kategori frasa penyusun kalimat dibutuhkan dalam proses pemrosesan

Pendahuluan • Syntax Parsing • Pelabelan kategori frasa penyusun kalimat dibutuhkan dalam proses pemrosesan bahasa alami. • Tiap kata atau kelompok kata yang berfungsi sebagai penyusun kalimat atau ujaran diberi label sesuai dengan kategori frasanya. 49

Konsep Dasar • Dalam bahasa Indonesia, sebuah rangkaian kata yang mempunyai sebuah gagasan di

Konsep Dasar • Dalam bahasa Indonesia, sebuah rangkaian kata yang mempunyai sebuah gagasan di dalamnya disebut kalimat. Contoh Winda membeli payung lipat. – Winda – Membeli payung : pokok (subjek) : sebutan (predikat) 50

Konsep Dasar (cont) • Rangkaian tersebut tidak memiliki gagasan jika hanya terdiri atas Winda,

Konsep Dasar (cont) • Rangkaian tersebut tidak memiliki gagasan jika hanya terdiri atas Winda, dan begitu pula sebaliknya, jika terdiri atas membeli payung lipat saja. • Penutur asli bahasa Indonesia dapat memilah rangkaian di atas menjadi – Winda | membeli payung lipat, atau – Winda | membeli | payung lipat atau – Winda | membeli | payung | lipat. 51

Konsep Dasar (cont) • Kelompok dua kata atau lebih yang mempunyai hubungan induk (head)

Konsep Dasar (cont) • Kelompok dua kata atau lebih yang mempunyai hubungan induk (head) - pewatas (modifier) seperti pada membeli payung lipat (induk: membeli; pewatas: payung lipat) atau payung lipat (induk: payung; pewatas: lipat) disebut frasa. 52

Konsep Dasar (cont) • Pewatas: – (sesuatu) yang digunakan untuk membatasi [KBBI] – Cat:

Konsep Dasar (cont) • Pewatas: – (sesuatu) yang digunakan untuk membatasi [KBBI] – Cat: watas = batas. • Modifier: – a word, phrase, or sentence element that limits or qualifies the sense of another word, phrase, or element in the same construction [dictionary. com]. – a word or phrase that is used with another word or phrase to limit or add to its meaning [Cambridge dictionary]. 53

Konsep Dasar (cont) • Kadang kala, gagasan di dalam kalimat dapat lebih daripada satu,

Konsep Dasar (cont) • Kadang kala, gagasan di dalam kalimat dapat lebih daripada satu, contoh: Winda membeli payung lipat karena bentuknya lebih praktis. • Pada kalimat di atas terdapat dua gagasan, – Winda membeli payung lipat dan – bentuknya lebih praktis • Bagian-bagian kalimat yang mengandung sebuah gagasan pada kasus kalimat kompleks di atas disebut klausa. 54

Konsep Dasar (cont) • Hubungan di antara dua klausa atau lebih pada sebuah kalimat

Konsep Dasar (cont) • Hubungan di antara dua klausa atau lebih pada sebuah kalimat dapat bersifat: – subordinatif jika relasinya berupa penjelasan – koordinatif jika relasinya berupa penambahan atau penggabungan. 55

Konsep Dasar (cont) • Contoh relasi klausa yg subordinatif Winda membeli payung lipat karena

Konsep Dasar (cont) • Contoh relasi klausa yg subordinatif Winda membeli payung lipat karena bentuknya lebih praktis menjelaskan alasan Winda membeli payung lipat. • Contoh relasi klausa yg subordinatif Winda membeli payung lipat, tetapi Nina memilih payung panjang. Winda membeli payung lipat dan Nina memilih payung panjang merupakan dua peristiwa yg berjalan sendiri, namun pada kalimat di atas digabungkan unt dikontraskan. 56

Bangun Struktur Kalimat • Bagaimana menelusuri kerangka atau struktur kalimat? Tentu saja kita harus

Bangun Struktur Kalimat • Bagaimana menelusuri kerangka atau struktur kalimat? Tentu saja kita harus membagi-bagi kalimat hingga menjadi kata. Winda | membeli | payung | lipat | karena | bentuk | nya | lebih | praktis • Langkah selanjutnya adalah melihat relasi di antara kata dengan kata-kata di sampingnya. • Saran: mulailah dari kata yang paling akhir. 57

Bangun Struktur Kalimat (cont) • Kita harus menentukan kata mana saja yang bergabung atau

Bangun Struktur Kalimat (cont) • Kita harus menentukan kata mana saja yang bergabung atau berhubungan dengan kata mana terlebih dahulu. • Pada contoh di atas, terdapat tiga kelompok kata atau frasa yang tergabung terlebih dahulu pada tahap pertama: – payung lipat, – bentuknya, dan – lebih praktis. 58

Bangun Struktur Kalimat (cont) • Payung lipat dan bentuknya merupakan frasa nominal (NP), sedangkan

Bangun Struktur Kalimat (cont) • Payung lipat dan bentuknya merupakan frasa nominal (NP), sedangkan lebih praktis merupakan frasa adjektival (ADJP). 59

Bangun Struktur Kalimat (cont) • Pada tahap kedua, relasi terdekat adalah antara kata membeli

Bangun Struktur Kalimat (cont) • Pada tahap kedua, relasi terdekat adalah antara kata membeli dan frasa payung lipat yang membentuk frasa verbal (VP). 60

Bangun Struktur Kalimat (cont) • Pada tahap ketiga, relasi berikutnya adalah di antara –

Bangun Struktur Kalimat (cont) • Pada tahap ketiga, relasi berikutnya adalah di antara – Winda dan membeli payung lipat – bentuknya dan lebih praktis • Kedua relasi tersebut menciptakan dua buah klausa (SBAR) yang menyampaikan dua gagasan. 61

Bangun Struktur Kalimat (cont) • Pada tahap terakhir, dua klausa yg ada yaitu –

Bangun Struktur Kalimat (cont) • Pada tahap terakhir, dua klausa yg ada yaitu – klausa Winda membeli payung lipat dan – klausa terikat karena bentuknya lebih praktis relasi digabungkan menjadi kalimat (S). 62

Bangun Struktur Kalimat (cont) • Pada bahasa percakapan, sering dijumpai penghilangan atau pelesapan unsur

Bangun Struktur Kalimat (cont) • Pada bahasa percakapan, sering dijumpai penghilangan atau pelesapan unsur klausa. • Misalnya pada klausa bentuknya lebih praktis, frasa bentuknya tidak diungkapkan. Lalu, bagaimana membina strukturnya? 63

Bangun Struktur Kalimat (cont) • Pada contoh klausa terikat yang mendahului klausa induk, contoh

Bangun Struktur Kalimat (cont) • Pada contoh klausa terikat yang mendahului klausa induk, contoh pembinaan strukturnya adalah sebagai berikut. 64

Bangun Struktur Kalimat (cont) • Pada dua klausa yang mempunyai relasi koordinatif, contoh pembinaan

Bangun Struktur Kalimat (cont) • Pada dua klausa yang mempunyai relasi koordinatif, contoh pembinaan strukturnya adalah sebagai berikut. 65

Pelabelan Struktur Kalimat Bhs Indonesia INACL Isi diambil dari dokumen INACL. Outline • Frasa,

Pelabelan Struktur Kalimat Bhs Indonesia INACL Isi diambil dari dokumen INACL. Outline • Frasa, klausa, kalimat – Konsep Dasar – Bangun Struktur Kalimat • Daftar Label – Label Kategori Frasa – Label Penggabung Kata • Contoh Penerapan – – – Kalimat Tunggal Kalimat Koordinatif (Kalimat Majemuk Setara) Kalimat Subordinatif (Kalimat Majemuk Tak Setara) Kalimat Pertanyaan Kalimat Ber kata kerja Berderet 66

Daftar Label: Label Kategori Frasa • Frasa Nominal (Noun Phrase) (NP), yaitu frasa yang

Daftar Label: Label Kategori Frasa • Frasa Nominal (Noun Phrase) (NP), yaitu frasa yang intinya berupa nomina. Contoh: kegagalan ini, satu poin, lokasi proyek • Frasa Verbal (Verb Phrase) (VP), yaitu frasa yang terdiri dari frasa verbal dan keterangan Contoh: memasuki jalur, terpecah belah • Frasa Adjektival (Adjectival Phrase) (ADJP), yaitu Frasa yang intinya berupa adjektiva. Contoh: cukup_ADJ lumayan, ramah_ADJ lingkungan 67

Label Kategori Frasa (cont) • Frasa Adverbial (Adverbial Phrase) (ADVP) Contoh: lebih_ADV dari, agak

Label Kategori Frasa (cont) • Frasa Adverbial (Adverbial Phrase) (ADVP) Contoh: lebih_ADV dari, agak terlalu • Frasa Preposisional (Prepositional Phrase) (PP), yaitu frasa nominal yang didahului dengan preposisi. Contoh dari_PPO Bandung, pada_PPO lokasi proyek, untuk_PPO menunjukkan 68

Label Kategori Frasa (cont) • Kalimat (Sentence) (S) , yaitu kalimat lengkap • Kalimat

Label Kategori Frasa (cont) • Kalimat (Sentence) (S) , yaitu kalimat lengkap • Kalimat Tanya (SQ), yaitu Kalimat tanya langsung yang didahului dengan kata tanya dan diakhiri dengan simbol tanda tanya. 69

Label Kategori Frasa (cont) • Klausa Inti (Main Clause) (SBAR) • Klausa Relatif (Relative

Label Kategori Frasa (cont) • Klausa Inti (Main Clause) (SBAR) • Klausa Relatif (Relative Clause) (RPN) ditandai dengan kata 2 al. yang, tempat, di mana. Contoh: proyek yang masih berjalan. • Klausa Terikat (Complementizer Phrase) (CP) ditandai dengan kata 2 al. bahwa, di mana, bagaimana. Contoh: bahwa gempa telah menghantam Chittagong 70

Daftar Label: Label Penggabungan Kata • Label ini digunakan untuk kata majemuk (compound word)

Daftar Label: Label Penggabungan Kata • Label ini digunakan untuk kata majemuk (compound word) atau nomina nama diri (proper noun) yang unsur -unsurnya terpisahkan oleh mesin pelabelan • Misalnya: – – – Lionel, Messi > Lionel Messi; rumah, sakit > rumah sakit; kambing, hitam > kambing hitam di, atas > di atas akan, tetapi > akan tetapi 71

Contoh • Andrea Masi membuka skor di menit keempat dengan satu percobaan untuk Italia.

Contoh • Andrea Masi membuka skor di menit keempat dengan satu percobaan untuk Italia. 72

 • Andrea Masi membuka skor di menit keempat dengan satu percobaan untuk Italia.

• Andrea Masi membuka skor di menit keempat dengan satu percobaan untuk Italia. 73

Contoh (cont) • Kalimat koordinatif (kalimat majemuk setara) Portugal tidak pernah menyerah dan David

Contoh (cont) • Kalimat koordinatif (kalimat majemuk setara) Portugal tidak pernah menyerah dan David Penalva mencetak skor melalui percobaan di menit ke-33 yang menjadi skor akhir mereka. 74

75

75

Contoh (cont) • Kalimat Pertanyaan Mengapa Anda melakukan itu? Apanya yang lucu? Ini konyol.

Contoh (cont) • Kalimat Pertanyaan Mengapa Anda melakukan itu? Apanya yang lucu? Ini konyol. 76

77

77

Tataran Linguistik (4): Semantik • • Hakikat Makna Jenis Makna Relasi Makna Medan Makna

Tataran Linguistik (4): Semantik • • Hakikat Makna Jenis Makna Relasi Makna Medan Makna dan Komponen Makna 78

Hakikat Semantik 79

Hakikat Semantik 79

Jenis Makna • Makna leksikal, gramatikal dan kontekstual – Makna leksikal: tanpa konteks apapun.

Jenis Makna • Makna leksikal, gramatikal dan kontekstual – Makna leksikal: tanpa konteks apapun. Misal kuda yang dimaksud binatang kuda. – Makna gramatikal: setelah ada kalimat. Contoh berkuda maksudnya mengendarai kuda – Makna kontekstual: yg berada dalam satu konteks. Rambut di kepala nenek belum ada yg putih. Sebagai kepala sekolah dia harus menegur murid itu. Nomor teleponnya ada pada kepala surat itu. 80

Relasi Makna • Hubungan semantik antara satuan bahasa dengan satuan bahasa lain. Satuan bahasa:

Relasi Makna • Hubungan semantik antara satuan bahasa dengan satuan bahasa lain. Satuan bahasa: kata, frase, kalimat. – Sinonim, antonim, polisemi (mempunyai lbh dari satu makna), homonim, hipernim 81

Medan Makna • Adanya perbedaan detil pada setiap bahasa (kemungkinan krn budaya dll). Misal

Medan Makna • Adanya perbedaan detil pada setiap bahasa (kemungkinan krn budaya dll). Misal – Unt saudara kandung kata utamanya • pada Bhs Indonesia: kakak dan adik (berdasarkan usia) • pada Bhs Inggris: brother dan sister (berdasar gender) • Berdasarkan sifat hubungan, bisa dibedakan atas dua domain: – Domain kolokasi (menunjukkan hubungan sintagmatik, krn sifatnya yg linear). – Domain set (menunjukkan hubungan paradigmatik, krn saling bisa disubsitusikan). 82

Medan Makna (cont) • Contoh – Kolokasi: layar, perahu, nelayan, badai, ombak, dan tenggelam.

Medan Makna (cont) • Contoh – Kolokasi: layar, perahu, nelayan, badai, ombak, dan tenggelam. Misal dengan kalimat: Tiang layar perahu nelayan itu patah dihantam badai, lalu perahu itu digulung ombak dan tenggelam beserta segala isinya. – Set: 83

Medan Makna (cont) 84

Medan Makna (cont) 84

Komponen Makna • Setiap kata mempunyai makna, makna kata terdiri dari sejumlah komponen (yi.

Komponen Makna • Setiap kata mempunyai makna, makna kata terdiri dari sejumlah komponen (yi. komponen makna) yg membentuk keseluruhan maksa kata tsb. – Contoh memiliki komponen makna, unt kata • ayah: /+manusia/, /+dewasa/, /+jantan/, /+kawin/, /+punya anak/ • ibu: /+manusia/, /+dewasa/, /-jantan/, /+kawin/, /+punya anak/ 85

Komponen Makna (cont) + artinya memiliki, - tdk memiliki 86

Komponen Makna (cont) + artinya memiliki, - tdk memiliki 86

Komponen Makna (cont) • Analisis komponen makna bisa digunakan unt membandingkan kata pada bahasa

Komponen Makna (cont) • Analisis komponen makna bisa digunakan unt membandingkan kata pada bahasa yg berbeda. 87

Komponen Makna (cont) • Analisis komponen makna bisa digunakan unt mencari perbedaan dari sinonim.

Komponen Makna (cont) • Analisis komponen makna bisa digunakan unt mencari perbedaan dari sinonim. 88

Komponen Makna (cont) • Sehingga kita misalnya bisa memilih kata yang tepat unt kata

Komponen Makna (cont) • Sehingga kita misalnya bisa memilih kata yang tepat unt kata sinonim sesuai dengan konteksnya. 89

Kesesuaian Semantik dan Sintaktik • Diterima tdknya sebuah kalimat bisa karena gramatikal, tapi juga

Kesesuaian Semantik dan Sintaktik • Diterima tdknya sebuah kalimat bisa karena gramatikal, tapi juga bisa semantik. – Kambing yang Pak Udin terlepas lagi – Segelas kambing minum setumpuk air – Kambing itu membaca komik 90

Terima Kasih 91

Terima Kasih 91

Daftar Pustaka • Abdul Chaer “Linguistik Umum (Edisi Revisi)” Penerbit Rineka Cipta, 2014. •

Daftar Pustaka • Abdul Chaer “Linguistik Umum (Edisi Revisi)” Penerbit Rineka Cipta, 2014. • Cheng. Xiang Zhai, Sean Massung “Text Data Management and Analysis: A Practical Introduction to Information Retrieval and Text Mining”, ACM- Morgan Claypool, 2016. 92