Unicode vereint unterschiedliche Zeichensätze wie zum Beispiel arabische, japanische, kyrillische und lateinische Zeichensätze und wird so grundlegender internationaler Kodierungsstandard für die Daten im semantischen Web. Unicode ordnet jedem Zeichen eine eigene Nummer zu, die so leichter und unmissverständlicher durch Computer interpretiert werden kann. Durch diese nummerische Zuordnung ist Unicode systemunabhängig, programmunabhängig und sprachunabhängig.
Ein URI (Uniform Resource Identifier) besteht aus einer Kette von Zeichen, die eine abstrakte oder physikalische Ressource identifiziert. Eine solche Quelle könnten Dokumente, Bilder, herunterladbare Dateien oder ähnliches im Web sein oder auch physikalische Geräte wie Fernseher, Kühlschrank oder Rundfunkradio. Der URI macht diese verschiedenen Quellen verfügbar und teilt ihnen eine eindeutige Adresse zu. Dabei verwendet der URI eine Vielzahl von unterschiedlichen Namensschemata und Zugangsmethoden wie etwa HTTP oder FTP. Die wohl unter Laien bekannteste Unterkategorie von Uniform Resource Identifiern (URI) ist der Uniform Resource Locator (URL), der zur Adressierung und Identifikation von Webseiten im Internet genutzt wird.
Alle die nun folgenden Technologien bauen auf die jeweils vorher beschriebenen Technologien auf oder verwenden diese zumindest teilweise.
Die nächste Technologie, die beleuchtet wird ist die Extensible Markup Language (XML).