Bytecodemanipulation Vortrag im Rahmen des Seminars Generatives Computing
Bytecodemanipulation Vortrag im Rahmen des Seminars Generatives Computing 16. 06. 2004 Ronald Kutschke Daniel Haag Mirko Bleyh Markus Block
Bytecodemanipulation [ Einleitung ] Übersicht • • • Motivation Classfile Format Java Virtual Machine Möglichkeiten Vor- / Nachteile Beispiel: Framework BCEL Weitere Anwendungsgebiete Fazit Quellen
Bytecodemanipulation [ Einleitung ] Motivation Warum Bytecodemanipulation? • Kein Sourcecode vorhanden • Änderung am Bytecode einfacher, als am Sourcecode
Bytecodemanipulation [ Classfile Format ] Classfile Format
Bytecodemanipulation [ Classfile Format ] Aufbau
Bytecodemanipulation [ Classfile Format ] Beispiel (1)
Bytecodemanipulation [ Classfile Format ] Beispiel (2)
Bytecodemanipulation [ Classfile Format ] Beispiel (3)
Bytecodemanipulation [ Classfile Format ] Constantpool (1)
Bytecodemanipulation [ Classfile Format ] Constantpool (2)
Bytecodemanipulation [ Classfile Format ] Constantpool (3)
Bytecodemanipulation [ Classfile Format ] Inhalt Constantpool Base. Type Character Type Interpretation B byte signed byte C char Unicode character D double-precision floating-point value F float single-precision floating-point value I integer J long integer L<classname>; reference an instance of class <classname> S short signed short V void Return type void Z boolean true or false [ reference one array dimension 12
Bytecodemanipulation [ Classfile Format ] Methodendefinition
Bytecodemanipulation [ Classfile Format ] Security class Login{ private String passwort = “xyz“; . . . public void login(String eingabe){ if(passwort. equals(eingabe)) { //login durchführen } }. . . } 14
Bytecodemanipulation [ Classfile Format ] Optimierung (1)
Bytecodemanipulation [ Classfile Format ] Optimierung (2)
Bytecodemanipulation [ JVM ] Java Virtual Machine • Zentrales Element der Java Technologie • Verantwortlich für Plattform-Unabhängigkeit • Abstrakte Rechenmaschine mit fester Anzahl an Instruktionen (Opcodes), die auf verschiedenen Speicherbereichen operiert • Kennt keine Java Programmiersprache, lediglich das Bytecode-Format • Kann in Hardware oder in Software realisiert werden
Bytecodemanipulation [ JVM ] JVM Details Spezifizierte Aufgaben einer JVM: – Lesen von Bytecode – Ausführen der definierten Operationen Alles weitere ist dem Entwickler überlassen, also z. B. – Speicheranordnung der Runtime Data Areas – Algorithmus der Garbage-Collection – Ausführungsart der Operationen (Interpretieren oder in nativen Code kompilieren und dann ausführen)
Bytecodemanipulation [ JVM ] JVM-Architektur
Bytecodemanipulation [ Class Loader ] Motivation – Speicherort der Klassen kann sehr unterschiedlich sein: • • Lokales Dateisystem Entferntes Dateisystem Datenbank Internet – Zentraler Punkt zum Laden von Klassen Erhöhte Sicherheit
Bytecodemanipulation [ Class Loader ] Aufgaben Um eine Klasse verwenden zu können, muss Folgendes von der VM bzw. dem Class Loader erledigt werden: – Dynamisches Laden der Klasse: • Finden der binären Repräsentation der Klasse (Bytecode) und erzeugen einer Klasse aus diesem – Linken der Klasse: • Verifizieren • Reservieren und Initialisieren von Speicher für Klassenvariablen • Transformieren von symbolischen Referenzen in direkte Referenzen – Initialisieren der Klasse: • Ausführen der <clinit> Methode der Klasse, Initialisieren der Klassenvariablen
Bytecodemanipulation [ Class Loader ] Bootstrap Class Loader Problem: Der Class Loader selber ist auch eine Java Klasse! Wer lädt diesen? Antwort: Der Bootstrap Class Loader: – – – Er ist Teil der JVM Er ist zumeist in der selben Sprache wie die VM geschrieben Wird beim Hochfahren der VM geladen Lädt alle weiteren Class Loader und die Klassen des Java API Nur vom ihm geladene Klassen werden als vertrauenswürdig eingestuft – JDK 1. 1: Benötigt unter Windows die CLASSPATH Umgebungsvariable – JDK 1. 2: System Class Loader durchsucht den CLASSPATH selber
Bytecodemanipulation [ Class Loader ] public class Simple. Class. Loader extends Class. Loader { public synchronized Class load. Class(String name, boolean resolve) { Class c = find. Loaded. Class(name); if (c != null) return c; try { c = find. System. Class(name); if (c != null) return c; } catch (Class. Not. Found. Exception e) {} try { Random. Access. File file = new Random. Access. File("test/" + name + ". class", "r"); byte data[] = new byte[(int)file. length()]; file. read. Fully(data); c = define. Class(name, data, 0, data. length); } catch (IOException e) {} if (resolve) resolve. Class(c); return c; } }
Bytecodemanipulation [ Class Loader ] Parent Delegation Model Bezeichnet die Arbeitsteilung der verschiedenen Class Loader innerhalb einer JVM: – Seit JDK 1. 2 vorgeschlagen, bereits in java. lang. Class. Loader realisisert – Jeder Class Loader besitzt Referenz auf Parent (ausser BCL) – Anfrage zum Laden einer Klasse wird immer erst an den Parent weitergegeben – Wenn Parent Klasse nicht finden, versucht es der CL selber
Bytecodemanipulation [ JVM ] JVM-Architektur
Bytecodemanipulation [ Runtime Data Areas ] • Method Area: – Enthält alle Klassen-Informationen (Name, Superklasse, Constant Pool, Methoden-Informationen und –Bytecode, Exception-Table, Klassenvariablen, etc. ) – Gehört logisch zum Heap • Heap: – Hier werden alle Objekt-Instanzen und Array gespeichert (d. h. Objekt-Referenzen zeigen auf Speicherbereiche im Heap): • Instanzvariablen der Klasse des Objekts und aller Superklassen • Zeiger auf den Speicherbereich der Klassendaten in der Method Area – Für alle Threads gemeinsam
Bytecodemanipulation [ Runtime Data Areas ] • PC Register: – Jeder Thread hat eigenen PC Register – PC Register ist ein Wort groß – Enthält „Adresse“ (nativer Pointer oder Offset des Bytecodes) der aktuell ausführenden Instruktion bzw. ist undefiniert beim Ausführen von nativem Code • Native Method Stack: – Führt Programm-Code aus, der nicht in Java geschrieben ist – Optional
Bytecodemanipulation [ Runtime Data Areas ] • Java Stack: – Jeder Thread hat eigenen Stack – Nur zwei mögliche Operationen: PUSH und POP – Stack besteht aus einzelnen Stack Frames: • zu jeder Methode gibt es einen Frame • immer genau ein Frame ist aktuell (aktuelle Methode) • bei Methodenaufruf wird ein Frame erzeugt und zum neuen aktuelle Frame am Stack (push) • bei Methodenende (return oder Exception) wird der aktuelle Frame verworfen und der vorherige Frame wird zum aktuellen Frame (pop) – ein Thread kann nur auf seinen Stack zugreifen !
Bytecodemanipulation [ Runtime Data Areas ] • Stack Frame – Lokale Variablen: • Als 0 -basiertes Array aus Wörtern organisiert • Enthält Parameter und lokale Variablen der jeweiligen Methode – Operanden-Stack: • Als 0 -basiertes Array aus Wörtern organisiert • Lediglich PUSH und POP erlaubt (keine Indizierung möglich!) • Hauptspeicherort von Operanden für Instruktionen – Frame Daten: • Referenz auf Constant Pool der Klasse der Methode • Daten zur Wiederherstellen des vorherigen Frames bei normalem Methodenende • Exception Behandlung (Referenz auf Exception-Table der Methode) • Weitere Daten. . .
Bytecodemanipulation [ JVM ] JVM-Architektur
Bytecodemanipulation [ Execution Engine ] 3 unterschiedliche Bedeutungen: – Abstrakte Spezifikation: • für jede Bytecode Instruktion wird spezifiziert, was gemacht werden soll, aber nicht wie! – Konkrete Implementierung: • Interpretation, JIT-Kompilierung, etc. – Laufzeit-Instanz: • Jeder Thread ist eine Instanz einer Execution Engine
Bytecodemanipulation [ Execution Engine ] Implementierungen • Interpretation – sehr einfach (1. Generation der VMs) • Just-in-Time Kompilierung – 1. Ausführung einer Methode → nativer Code • Adaptive Optimierung – – Mischung aus Interpretation und JIT Kompilierung Code-Ausführung wird beobachtet 80 - 90 % der CPU Zeit → 10 - 20 % des Codes wird z. B. in Suns Hot. Spot VM verwendet
Bytecodemanipulation [ JVM ] Funktionsweise der JVM Applet Demo. . .
Bytecodemanipulation [ Möglichkeiten ] Möglichkeiten • • Einfügen von Debuginformationen Einfügen von Tracinginformationen Besseres Handling von Null. Pointer. Exceptions Umbenennen von Variablen- und Methodennamen um Bytecode unleserlich zu machen (Obfuskator) • Einfügen von Code zur Serialisierung (JDO) • Bytecodeoptimierung
Bytecodemanipulation [ Vor- / Nachteile ] Vorteile • Sourcecode muss nicht vorliegen • Code kann dynamisch zur Ladezeit verändert werden • Einfügen von fest vorgegebenem Code, der von Programmierern nicht verändert werden kann
Bytecodemanipulation [ Vor- / Nachteile ] Nachteile • Aufwändig – Genaue Kenntnis des Classfile-Formats, der Opcodes und der VM sind Voraussetzung – Fehlen von Kommentaren • Fehler erscheinen erst zur Laufzeit
Bytecodemanipulation [ BCEL ] Byte Code Engineering Library (BCEL) • Objektorientierte Bearbeitung des prozeduralen Bytecodes – Mappen sämtlicher Opcodes in Java Klassen • Getrennte Packages zum – Analysieren und Inspizieren – Modifizieren und Erzeugen • Manipulation nach der Compile- oder zur Ladezeit • Bytecode Verifier • Disassembler
Bytecodemanipulation [ BCEL ] Verwendung von BCEL • Einlesen und parsen des Classfiles -> Java. Class • Auslesen der Klassenparameter (Methoden, Constant Pool, Felder, …) • Generatoren der Klassenparameter erzeugen • Manipulation über die Generator Objekte • Ersetzen der alten Parameter durch die neuen aus den Generatorobjekten • Zurückschreiben des Classfiles auf Festplatte
Bytecodemanipulation [ BCEL ] Aufruf von statischen Methoden • • • Hinzufügen der Methode zum Constant Pool Sichern der Referenz zur Methode Parameter auf den Stack legen Die Methode mit INVOKESTATIC(Methodenref) aufrufen Rückgabewert liegt nach dem Aufruf auf dem Stack
Bytecodemanipulation [ BCEL ] Aufruf von nicht-statischen Methoden • • • Hinzufügen der Methode zum Constant Pool Sichern der Referenz zur Methode Referenz des Methodenobjektes auf den Stack legen Parameter auf den Stack legen Die Methode mit INVOKEVIRUTAL(Methodenref) aufrufen Rückgabewert liegt nach dem Aufruf auf dem Stack
Bytecodemanipulation [ BCEL ] Einfügen der Methodenaufrufe • • Gewünschte Methode finden Generator Objekt davon erstellen Codestelle innerhalb der Methode zum Einfügen finden Gewünschte Aufrufe einfügen
Bytecodemanipulation [ BCEL ] Beispiel • Einfügen von „Hello from „ + Methodensignatur beim Aufruf jeder Methode einer Klasse (nach Compile Time) • Einfügen von Tracing und Logging Informationen beim Aufruf und Verlassen jeder Methode einer Klasse (zur Loading Time)
Bytecodemanipulation [ Frameworks ] Weitere Frameworks • BCEL • Jikes Bytecode Toolkit (Jikes. BT) • Javassist – Ermöglicht abstraktere Bytecode Manipulation über Method. append("System. out. println("Test");
Bytecodemanipulation [ Fazit ] Fazit • Bytecodemanipulation ermöglicht die Erweiterung, Optimierung und Anpassung von Classfiles • Es ersetzt jedoch nicht das herkömmliche Programmieren in Java, da die Komplexität bedeutend höher ist
Bytecodemanipulation [ Quellen ] Quellen (1) • Analysis Of The Java Class File (Denis N. Antonioli, Markus Pilz) • The Java. TM Virtual Machine Specification Second Edition (Tim Lindholm, Frank Yellin) ftp: //ftp. ifi. unizh. ch/pub/techreports/TR-98/ifi-98. 04. ps. gz http: //java. sun. com/docs/books/vmspec/2 nd-edition/html/VMSpec. TOC. doc. html • Inside the Java 2 Virtual Machine (Bill Venners) + Applets http: //www. artima. com/insidejvm/applets http: //www. artima. com/insidejvm/ed 2/jvm. html
Bytecodemanipulation [ Quellen ] Quellen (2) • Java Programming Dynamics (Dennis M. Sosnoski) • BCEL Homepage • Beispiele für BCEL • Javassist Homepage • Jikes. BT Homepage http: //www-106. ibm. com/developerworks/java/library/j-dyn 0429 http: //jakarta. apache. org/bcel http: //bcel. sourceforge. net http: //www. jboss. org/developers/projects/javassist. html http: //www. alphaworks. ibm. com/tech/jikesbt
Bytecodemanipulation Fragen zum Thema?
Bytecodemanipulation Kontakt • Ronald Kutschke rk 10@hdm-stuttgart. de • Daniel Haag dh 12@hdm-stuttgart. de • Mirko Bleyh mb 49@hdm-stuttgart. de • Markus Block mb 48@hdm-stuttgart. de
- Slides: 48