XML (Extensible Markup Language) adalah bahasa markup yang mempunyai himpunan aturan untuk pengkodean dokumen dalam format yang dimengerti oleh manusia dan mesin
XML didesain untuk mempu menyimpan data secara ringkas dan mudah diatur. Kata kunci utama XML adalah data (jamak dari datum) yang jika diolah bisa memberikan informasi.
XML menyediakan suatu cara terstandarisasi namun bisa dimodifikasi untuk menggambarkan isi dari dokumen. Dengan sendirinya, XML dapat digunakan untuk menggambarkan sembarang view database, tetapi dengan suatu cara yang standar.
Tujuan perancangan dari XML menekankan pada kesederhanaan, keumuman, dan
kegunaan melalui Internet. XML adalah format data tekstual dengan
dukungan yang kuat melalui Unicode untuk bahasa-bahasa di seluruh dunia.
Meskipun desain dari XML memfokuskan pada dokumen, yang digunakan
secara luas untuk representasi struktur data yang bebas, sebagai contoh
pada web services.
Banyak application programming interfaces (APIs) telah dikembangkan
untuk memproses data XML, dan ada beberapa sistem skema untuk membantu
dalam proses mendefinisikan dari bahasa berbasis XML.
Pada tahun 2009, ratusan bahasa berbasis XML telah dikembangkan,
termasuk RSS, Atom, SOAP, dan XHTML. Format berbasis XML telah menjadi
standar bagi banyak kakas office-productivity, termasuk Microsoft Office
(Office Open XML), OpenOffice.org dan LibreOffice (OpenDocument), dan
iWork dari Apple. XML juga diperlakukan sebagai bahasa baku untuk
protokol komunikasi, seperti XMPP (eXtensible Messaging and Presence
Protocol).
Tipe-tipe XML
- XML, merupakan standar format dari struktur berkas (file).
- XSL, merupakan standar untuk memodifikasi data yang diimpor atau diekspor.
- XSD, merupakan standar yang mendefinisikan struktur database dalam XML
Keunggulan XML bisa diringkas sebagai berikut :
- Pintar (Intelligence). XML dapat menangani berbagai tingkat (level) kompleksitas.
- Dapat beradaptasi. Dapat mengadaptasi untuk membuat bahasa sendiri. Seperti Microsoft membuat bahasa MSXML atau Macromedia mengembangkan MXML.
- Mudah pemeliharaannya.
- Sederhana. XML lebih sederhana.
- Mudah dipindah-pindahkan (Portability). XML mempunyai kemudahan perpindahan (portabilitas) yang lebih bagus.
Contoh dokumen XML sederhana
<?xml version="1.0" encoding="UTF-8"?> <Resep nama="roti" waktu_persiapan="5 menit" waktu_masak="3 jam"> <judul>Roti tawar</judul> <bahan jumlah="3" satuan="cangkir">tepung</bahan> <bahan jumlah="0,25" satuan="ons">ragi</bahan> <bahan jumlah="1,5" satuan="cangkir">air hangat</bahan> <bahan jumlah="1" satuan="sendok teh">garam</bahan> <Cara_membuat> <langkah>Campur semua bahan dan uleni adonan sampai merata.</langkah> <langkah>Tutup dengan kain lembap dan biarkan selama satu jam di ruangan yang hangat.</langkah> <langkah>Ulangi lagi, letakkan di loyang dan panggang di oven.</langkah> <langkah>Keluarkan, hidangkan</langkah> </Cara_membuat> </Resep>
Terminologi Kunci
Materi pada bagian ini berdasarkan pada spesifikasi XML. Tidak semua dituliskan, hanya terminologi yang sering dipakai saja.
(Unicode) Character
Definisi sebuah dokumen XML adalah kumpulan dari karakter. Hampir semua karakter Unicode yang legal bisa tampil di dokumen XML.
Prosesor dan Aplikasi
Prosesor menganalisa markup, kemudian melempar informasi yang
terstruktur ke sebuah aplikasi. Spesifikasi XML mempunyai kebutuhan yang
menentukan apa yang harus dilakukan dan tidak dilakukan oleh sebuah
prosesor XML, tetapi tidak untuk aplikasinya. Prosesor XML juga sering
disebut XML parser.
Markup dan Konten
Karakter yang membangun dokumen XML dibagi menjadi markup dan konten.
Markup dan konten dapat dikenali oleh aplikasi dengan aturan sintaksis
yang sederhana. Semua string yang merupakan sebuah markup dapat diawali
dengan karakter < dan diakhiri dengan > atau diawali dengan
karakter & dan diakhiri dengan ;. String yang bukan merupakan markup
adalah konten.
Tag
Tag adalah sebuah markup yang diawali dengan < dan diakhiri dengan >.
Ada tiga jenis tag:
- start-tags; contohnya: <section>
- end-tags; contohnya: </section>
- empty-element tags; contohnya: <line-break />
Elemen
Elemen adalah sebuah komponen dokumen logikal yang diawali oleh sebuah
start-tag dan diakhiri oleh end-tag yang sepadan dengan start-tag nya
atau berisi hanya sebuah empty-element tag. Karakter-karakter diantara
start-tag dan end-tag, jika ada, adalah konten dari elemen, dapat
mempunyai markup, elemen-elemen lain, yang disebut child elements.
Contoh dari elemen adalah <Greeting>Hello,
world.</Greeting>. Yang lainnya <line-break />.
Atribut
Sebuah rangkaian markup yang terdiri dari pasangan nama/nilai yang ada
dalam start-tag atau empty-element tag. Pada contoh berikut ini, elemen
img mempunyai dua atribut, src dan alt: <img src="madonna.jpg"
alt='Foligno Madonna, by Raphael' />. Contoh lain <step
number="3">Connect A to B.</step> dimana nama atributnya adalah
"number" dan nilainya "3".
Deklarasi XML
Dokumen XML dapat diawali dengan mendeklarasikan beberapa informasi mengenai dirinya, sebagai contoh:
<?xml version="1.0" encoding="UTF-8" ?>
RSS
RSS, awalnya RDF Site Summary (versi 1.0), sering disebut Really Simple
Syndication (versi 2.0), adalah sebuah rumpun format web feed yang
digunakan untuk mempublikasikan pekerjaan yang memerlukan update secara
reguler—seperti blog, berita, audio, dan video—dalam sebuah format yang
telah dibakukan. Sebuah dokumen RSS (yang disebut sebuah "feed", "web
feed", atau "channel") meliputi sebuah rangkuman teks ataupun teks
penuh, ditambah metadata seperti tanggal terbit dan pembuat/penulis.
RSS menguntungkan para penerbit untuk menggabungkan konten secara
otomatis. Sebuah format file XML memungkinkan informasi diterbitkan satu
kali dan dilihat melalui banyak sekali aplikasi yang berbeda. Hal ini
juga menguntungkan para pembaca yang ingin berlangganan update secara
berkala dari banyak website favorit mereka ke dalam satu tempat.
RSS feed dapat dibaca menggunakan perangkat lunak yang disebut "RSS
reader", "feed reader", atau "aggregator", dengan platform web-based,
desktop-based, atau mobile-device-based. Pengguna perangkat lunak
tersebut dapat berlangganan feed dengan memasuki URI feed-nya, atau
dengan mengklik sebuah ikon feed pada web browser yang menginisiasi
proses berlangganan. Perangkat lunak pembaca RSS memeriksa feed-feed
yang dilanggan oleh pengguna secara reguler untuk entry baru, mengunduh
update tersebut, dan menyediakan tampilan antarmuka untuk memonitor dan
membaca feed-feed tersebut. RSS memungkinkan para pengguna untuk
menghindari memeriksa semua website favorit mereka secara manual,
sebagai gantinya, mereka berlangganan ke website tersebut melalui RSS
reader.
Contoh RSS:
<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title>RSS Title</title>
<description>This is an example of an RSS feed</description>
<link>http://www.someexamplerssdomain.com/main.html</link>
<lastBuildDate>Mon, 06 Sep 2010 00:01:00 +0000 </lastBuildDate>
<pubDate>Mon, 06 Sep 2009 16:45:00 +0000 </pubDate>
<ttl>1800</ttl>
<item>
<title>Example entry</title>
<description>Here is some text containing an interesting description.</description>
<link>http://www.wikipedia.org/</link>
<guid>unique string per item</guid>
<pubDate>Mon, 06 Sep 2009 16:45:00 +0000 </pubDate>
</item>
</channel>
</rss>
EmoticonEmoticon