Terug naar de beginpaginaCentor Homepage

Diverse versies van Oracle's XML Developer's Kit te downloaden via het net

XML voor het eenvoudiger en efficiënter doorgeven van data via het web


XML staat voor eXtensible Markup Language. Deze tekst slaat als het ware een brug tussen SGML (Standard Generalized Markup Language) en de - wat beperkte - web-taal HTML (Hyper Text Markup Language). Tijdens een speciaal voor Centor-medewerkers gehouden presentatie van Erwin Groenendal van CumQuat Information Technology BV (uit Capelle aan den IJssel) werd ingegaan op XML en de rol die Oracle daarin speelt.


Standaardisering en normering spelen belangrijke rollen in onze wereld en vooral in de technologie. Internet en het world wide web zijn gebaseerd op wereldwijd geaccepteerde standaarden. Daardoor kunnen computers met verschillende besturingssystemen en uiteenlopende soorten software toch met elkaar communiceren. Het onderhoud en het beheer van die normen (evenals de bewaking dat niemand bijzonder voordeel heeft bij een bepaalde norm) ligt bij het World Wide Web Consortium (W3C). Deze instelling is ook verantwoordelijk voor de ontwikkeling van nieuwe normen. HTML, afbeeldingen, stylesheets, webservers enzovoort zijn allemaal gebaseerd op door W3C ontwikkelde normen. De door deze instelling gecreëerde normen zijn echter niet verplicht, maar worden wel aanbevolen. Aangezien de hele industrie bij die onderlinge aansluiting baat heeft, zal men niet snel van de normering afwijken. XML is een taal die werd ontwikkeld onder auspiciën van de XML-werkgroep van het W3C. XML is een taal die kan worden gebruikt voor het maken van markup-talen. Een markup-taal maakt gebruik van tags die rechtstreeks in teksten zijn verwerkt en een beschrijving geven van verschillende delen en elementen van de tekst.
Een simpel voorbeeld van Erwin Groenendal:

The quick brown <animal>fox</animal> jumps over the lazy <animal>dog</animal>

'Met XML markeer je dus als het ware specifieke informatie. Zo'n markering wordt een 'tag' genoemd. Er bestaat echter geen
XML-woordenboek. Iedere gebruiker moet zijn of haar eigen
XML-taal creëren (eigen 'tags' definiëren). Dat alles wel binnen de regels van de XML-standaard.
Als we XML en HTML vergelijken,' stelt Groenendal, 'zien we een overeenkomst: beide zijn markup-talen. Het probleem van het markeren van data bij gebruik van HTML is echter dat de presentatie in de data ingebouwd is, dat het zoeken naar de informatie binnen de data moeilijk is en dat de data vast zit aan de logica en de taal van HTML.'
De pluspunten van XML in vergelijking met HTML zijn, volgens hem 'de presentatie is gescheiden van de data, het opzoeken van data gaat gemakkelijk en op efficiënte wijze en XML beschrijft zichzelf.'
SGML was oorspronkelijk bedoeld voor het werken met publicaties op grote schaal. Het werd echter doorontwikkeld voor het eenvoudiger en efficiënter doorgeven van data via het web. Dit kon doordat XML het de ontwikkelaars mogelijk heeft gemaakt hun eigen Document Type Definitions (DTD's) te schrijven. Deze DTD's geven een beschrijving van de tags en kenmerken die kunnen worden ingezet voor het beschrijven van een document. DTD's zijn de voorschriften voor een markup-taal die een omschrijving geven van de markup-elementen (tag-woord-tag = een element) die gebruikt kunnen worden voor het beschrijven van een document. Wie zelf 'tags' wil vervaardigen, dient deze eerst in een DTD te definiëren. Indien u wilt dat uw DTD's en documenten correct functioneren dient u zich overigens wel strikt aan de XML-spelregels te houden! De individuele markup-talen die door XML zijn gedefinieerd, noemt men XML-vocabulaires of -toepassingen. XML definieert deze met DTD's. XML heeft het vermogen niet enkel inhoud te beschrijven maar ook metagegevens. Metagegevens betreft data die data beschrijft. Een simpel voorbeeld hiervan is een encyclopedie. Of een inhoudsopgave van een tijdschrift. Een duidelijke, consequent gehanteerde manier om metagegevens vast te leggen - en dat is het geval bij XML - zal uiteindelijk een strak in het vel zittende 'catalogus' van informatie van webbronnen tot gevolg hebben. Dat houdt in dat de inmiddels vele miljoenen sites en webpagina's op het world wide web efficiënter kunnen worden 'doorgebladerd'. Sleutelwoorden? Sneller, beter, makkelijker.
Met door DTD's gedefinieerde vocabulaires - toegespitst op specifieke soorten inhoud, zoals bijvoorbeeld MML (Mathematical Markup Language) en Chemical Markup Language (CML) - tilt XML webgegevens naar een nieuw niveau. Eerder werd al gesteld dat degene die wil dat zijn of haar DTD's en documenten goed functioneren, zich aan de XML-spelregels heeft te houden. Maar belangrijk is ook of browsers (zoekmachines) met uw creaties kunnen omgaan. En daarmee belanden we dan aan bij het hoofdstuk 'parsers'. Groenendal: 'We onderscheiden non-validating parsers en validating parsers. De eerste soort controleert of een XML-document goed is gebouwd en of het een geldige syntax heeft. De tweede, de validating parser, checkt of het XML-document geldig en conform de DTD is.'
Nu XML gebleken is geen modegril te zijn, maar een aanwinst in de webtechnologie, is geleidelijk aan een volledige ondersteuning voor XML in elke webbrowser ingebouwd.

Oracle en XML
Ook Oracle houdt zich bezig met XML. Oracle biedt u de Oracle XML Developer's Kit. Deze bevat de basis bouwblokken (stukken code die gebruikt kunnen worden) voor het lezen, manipuleren, omzetten en bekijken van XML-documenten. De kit is beschikbaar voor Java, JavaBeans, C, C++ en PL/SQL. Wat erin zit? XML parsers voor het creëren en parsen van XML waarbij gebruik wordt gemaakt van de industriële standaard DOM en SAX-interfaces (API's). Verder een XSLT processor die XML omzet naar andere, op tekst gebaseerde formats zoals HTML (en XML zelf) en ook zit er nog een XML schema validator in. Deze staat het u toe XML voor zowel eenvoudige als complexe datasoorten te gebruiken. En daarbij blijft het niet. De kit omvat ook nog de XML Class Generator die Java en C++ klassen genereert (gebaseerd op een DTD) om XML-documenten te kunnen genereren. Dan is er nog de XML Transviewer JavaBeans die XML-documenten en -data bekijkt en omzet via Java-componenten. Verder de XSQL Servlet die XML, SQL en XSLT in de server combineert om dynamische webcontent te kunnen genereren en XML SQL Utility (XSU) dat helpt een XML-document te generen als een SQL-vraag c.q. -verzoek wordt gesteld. Tevens is deze component van de kit in staat data uit een XML-document te halen om vervolgens in de database corresponderende data ervoor in de plaats te zetten of de data te updaten of verwijderen.

Website W3C
Heb je al eens op de website van het World Wide Web Consortium gekeken? Je vindt er niet alleen alle bestaande normen, maar ook de info over de normen die in ontwikkeling zijn. De bronnen die op en via deze website geraadpleegd kunnen worden zijn bijzonder informatief. www.w3.org

Oracle's XML Developer's Kit
Oracle's XML Developer's Kit is te downloaden via het Oracle Technology Network (http://technet.oracle.com/software/content.html). Kies daar voor downloads, kies een van de Kits die onderaan in het (openklapbare) rechterschermpje onderaan staan. U moet dan wel een gebruikersnaam met het bijbehorende password invullen om te kunnen downloaden. Echter dit is makkelijk en relatief snel te regelen. En zonder kosten