Schon im Vorwort spricht der Autor davon, dass dieses Buch – dies ist der Geschwindigkeit des Markts geschuldet – nicht nur die Arbeit mit spezifischen LLMs vorstellen möchte, sondern auch die dahinterstehenden Vorgehensweisen und Design Patterns zu vermitteln sucht.
Minimale Einstiegshürde
Nach einem ersten Kapitel, das die „Gestation“ der KI-LLM-Systeme vorstellt, beginnt der Autor mit einem praktischen Beispiel. Im Interesse der Aufwandsminimierung kommen dabei Spring Boot und die OpenAI-API zum Einsatz. Darauf folgt ein weiteres Kapitel, das Begriffe wie Tokenisation und Co. klärt. Der logisch letzte Akt der Einführung ist die Inbetriebnahme der Ollama-Umgebung. Dabei handelt es sich um ein System, das die lokale Ausführung von verschiedensten LLMs auf Workstations ermöglicht. Lobenswert ist, dass der Autor in diesem Bereich alternative Darbietungsformen von Ollama vorstellt, um dem Leser den bestmöglichen Überblick der Thematik zu gewähren.
Mit KI und LangChain4j auf Reisen
Wie im Fall vieler anderer technischer Probleme gilt auch bei der Nutzung von LLMs, dass Abstraktionsschichten zur Verfügung stehen. Ihre Nutzung sorgt – logischerweise – dafür, dass Änderungen an der Modellstruktur nicht zu umfangreichen Anpassungen an der Gesamtapplikation führen.
Im Rahmen der Vorstellung von LangChain4j und Spring AI schafft der Autor die Vermittlung verschiedene grundlegende Kulturtechniken im Bereich des Prompt Engineering. Neben Überlegungen dazu, wie man einem KI-Modell zu Gedächtnis bzw. Kontext-Haltungsfähigkeit verhelfen kann, finden sich Überlegungen zur Nutzung der RAG-Funktion. Bei korrekter Nutzung lassen sich an sich fertig parametrierte Modelle so mit zusätzlichem domainspezifischen Wissen ausstatten, was die Qualität der zurückgelieferten Antworten wesentlich erhöht.
Am Ende dieses Blocks findet sich dann wieder ein Rundumschlag-Kapitel, das auf Trends und Kulturtechniken im Bereich des Prompt Engineering eingeht. Nach dem Durchlesen dieses Teils hat der Entwickler ein Grundverständnis der Nutzung der beiden Frameworks, andererseits aber auch genügend Vokabular, um die Dokumentation anderer Systeme zu verstehen.
Agenten und Werkzeugaufrufe
Obwohl LLMs im Standalone-Betrieb zum Bewerkstelligen verschiedenster Geschäftsaufgaben nützlich sind, entfalten sie ihre maximale Schlagkraft nur dann, wenn sie mit dem „Rest“ des Systems verbunden sind.
Im ersten Akt illustriert der Autor dies anhand einer Werkzeug-Integration, die Wetter-Informationen herunterlädt und dem Modell zur Auswertung der Benutzeranfragen als zusätzlichen Datenstrom zur Verfügung stellt. Interessant ist hier auch, dass der Autor in einer Tabelle verschiedene Modelle in Bezug auf ihre Werkzeugintegration vergleicht.
Im Kapitel zur agentischen KI stellt das Werk Design Patterns vor, um im nächsten Schritt die Nutzung des Microframeworks Quarkus im Zusammenspiel mit verschiedenen AI-Systemen zu illustrieren. Sinn ist unter anderem die Vermittlung der Vorgehensweise, um AI-basierte Systeme und Verfahren in Microservicearchitekturen geschickt einsetzen zu können.
Java-Hosting, Bildverarbeitung und Cloudunterstützung
Der logisch nächste Themenkreis wendet sich im ersten Schritt der Jlama-Umgebung zu. Dabei handelt es sich um ein System, das „LLM-Container“ innerhalb einer Java-Applikation ausführen kann. Verschiedene Überlegungen zur Erzeugung und Verarbeitung von Bildern mit Java dienen dann als Überleitung zu einem vergleichsweise langen Kapitel, in dem sich der Autor an verschiedenen aus der Cloud zu kaufenden Diensten abarbeitet. Sehr interessant sind hier beispielsweise die Ausführungen zur Amazon Guardrails, da sie das Realisieren von mit den diversen amerikanischen Vorschriften übereinstimmenden Modellen und KI-Anwendungen ermöglichen.
Ein Kapitel zum Modern Context Protocol, oder kurz MCP, dient als Überleitung zu verschiedenen Überlegungen zur nativen Interaktion mit ML-Modellen. Fokus des Lesers des Autos liegt hier darin, dem Leser Grundlagenverständnis der jeweiligen Technologie (Stichworte beispielsweise DL4J, ONNX und OpenNLP) zu vermitteln und so zu eigenmächtigen weiteren Experimenten anzuregen. Der Round-up mit der Vorstellung diverser Umgebungen und Frameworks hilft jedenfalls dabei, den oft chaotischen Markt zu überblicken. Das zwanzigste und letzte Kapitel des Lehrbuchs präsentiert dann Möglichkeiten, um AI-basierte Systeme „abseits“ eines Monolithen zur Anwendung zu bringen.

Autor: Satej Kumar Sahu
Seiten: 698
Verlag: Apress
Jahr: 2026
ISBN: 979-8-8688-1608-6
Jede Menge Code
Der Apress-Verlag war einst – viele Jahre vor der Übernahme durch Springer – angetreten, um von Programmierern für Programmierer gedachte Bücher zu verfassen. Mit dem 713 PDF-Seiten langen „Generative AI-Driven Application Development with Java“ bleibt man diesem guten Credo treu – mitunter seitenweise Listings ermöglichen das Durchdenken der vorgeführten Aufgabe. Weder die Bebilderung noch die englische Sprache geben Anlass zur Kritik.
Fazit
Wer eine Einführung in die Spielarten der Nutzung von LLMs in Java begehrt, wird den Kauf von „Generative AI-Driven Application Development with Java“ auf keinen Fall bereuen. Das sehr detaillierte Lehrbuch schafft es einerseits, wichtige Fähigkeiten zu vermitteln – andererseits wird der Leser mit Hintergrundwissen versorgt, um eigenmächtige Experimente bequemer und kompetenter starten zu können. Unterm Strich eine volle Lese-Empfehlung für Praktiker, die sofort loscodieren wollen.