(Translated by https://www.hiragana.jp/)
GitHub - nile4000/pdf_reader-quarkus: PDF-Reader with Quarkus Backend and UI
Skip to content

nile4000/pdf_reader-quarkus

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Quarkus-PDF-Extract Projekt

pdfbox Übersicht

  • Konversion von Dokumenten.
  • PDF-Erstellung und Druckausgabe.

pdfbox Ziele

  • Endpunkt für PDF-Empfang.
  • Extraktion und Umwandlung von PDF-Zeilen.
  • Aufteilung nach Mustern: Artikel, Menge, Preis, Aktion, Total, Zusatz, Datum.

Dokumentation pdfReader

  • Applikationsbetrieb mit Quarkus.
  • GUI-Anpassung in "index.html".
  • In "ExtractCoopPosition": Positionsextraktion aus PDFs in "PDF_Documents".
  • Lesen und Ausdruck von PDFs im .txt mit PDFBox (PDFLayoutTextStripper).
  • Indexierung und Suche mit Lucene in "..\pdfextract\index".
  • Metadaten-Extraktion via PDFBox (PDFExtractionresource).

Starten

./mvnw compile quarkus:dev

UI Testen

  • Öffne http://localhost:8080/.
  • Wähle Datei in "/PDF_Documents".
  • Konvertiere Text mit "Einlesen (alles)".
  • Extrahiere Artikel mit "Einlesen (Coop-Artikel)".

Creating a native executable

You can create a native executable using:

./mvnw package -Dnative

About

PDF-Reader with Quarkus Backend and UI

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published