Exercise 1.2
Bandingkan Dokumen-dokemen ini :
Doc 1 : breakthrough drug for schizophrenia
Doc 2 : new schizophrenia drug
Doc 3 : new approach for treatment of schizophrenia
Doc 4 : new hopes for schizophrenia patients
a. Gambarkan kejadian istilah-dokumen matriks yang sesuai dengan dokumen di atas.
Doc 1 | Doc 2 | Doc 3 | Doc 4 | |
Breakthrough | 1 | 0 | 0 | 0 |
Drug | 1 | 1 | 0 | 0 |
For | 1 | 0 | 1 | 1 |
Schizophrenia | 1 | 1 | 1 | 1 |
New | 0 | 1 | 1 | 1 |
Approach | 0 | 0 | 1 | 0 |
Treatment | 0 | 0 | 1 | 0 |
Of | 0 | 0 | 1 | 0 |
Hopes | 0 | 0 | 0 | 1 |
Patients | 0 | 0 | 0 | 1 |

b. Gambarkan representasi inverted index untuk koleksi ini, seperti dalam Gambar 1.3

Exercise 1.7
Rekomendasikan pemrosesan order query untuk (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes) jika ukuran daftar posting sebagai berikut:

(tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes)
trees AND skies AND eyes Exercise 1.10
Tuliskan algoritma postingsmerge, dalam gaya Gambar 1.6 (halaman 11), untuk x y OR
query.
query.
Intersect (< t1,...,tn>)
1. terms « Sort By Increasing Frequency
2. result « Postings (first(terms))
3. terms « Rest (terms)
1. terms « Sort By Increasing Frequency
2. result « Postings (first(terms))
3. terms « Rest (terms)
4. while terms ≠ Nil OR result ≠ Nil
5. do result « INTERSECT (result, postings (first(terms))
6. terms « Rest (terms)
7. returns result
Gunakan google dan yahoo, coba beberapa query Boolean. Catat hasil yang di berikan dan bandingkan!


Dari hasil di atas dapat kita lihat bahwa yang lebih akurat dan banyaknya informasi yang di tampilkan yang lebih unggul adalah google. Kalau di yahoo kata yang di cari dengan hasil yang di tampilkan terkadang tidak ada kecocokan.