• Jeder User im Forum verpflichtet sich zur Akzeptanz und zur Einhaltung dieser Regeln:
    1. Umgangston
      Ein angemessener höflicher Umgangston, ohne Beleidigungen, Beschimpfungen und aggressive Postings ist für jedes Mitglied Pflicht.
    2. Beiträge
      Jedes Mitglied sollte sich bemühen nur sinnvolle Beiträge zum Thema zu posten. Dabei ist unbedingt vorher zu prüfen, ob das Thema vorher schon einmal diskutiert wurde und daher fortgesetzt werden kann
      • Suchfunktion benutzen!
      • offizielle Doku lesen!
    3. Haftung
      Jeder Beitragsersteller übernimmt die alleinige Verantwortung seiner Inhalte.
    4. Werbung
      Wir erlauben keine Beiträge, Signaturen, Private Nachrichten oder eMails an Benutzer, die Werbung enthalten. Ausgenommen
      sind Stellengesuche /-angebote, welche ausschließlich im Forum "Stellengesuche" veröffentlicht werden dürfen.
    5. Verstöße
      Regelwidrige Beiträge sollten dem Team gemeldet werden. Nach deren Überprüfung werden wir schnellstmöglich
      entsprechend handeln.
    6. Authorität
      Den Anweisungen der Team-Mitglieder (Administratoren und Moderatoren) sind in diesem Forum Folge zu leisten.
      Bei Fragen oder Beschwerden bitte an diese wenden.
    Wir möchten Euch darauf aufmerksam machen, dass es bei Verstößen gegen einen oder mehreren der oben genannten
    Punkte dem Team frei steht entsprechend zu handeln. Dies kann z.B. das Löschen eines Beitrags, das Ausschliessen bzw.
    Sperren von Mitgliedern oder aber lediglich eine Verwarnung sein.

    In diesem Zusammenhang sollte erwähnt werden, dass das Forum automatisch die IP-Adresse jedes Beitrag-Erstellers
    speichert. Bei schweren Vergehen, behalten wir es uns vor, die IP-Adresse zur Strafverfolgung weiterzugeben.
  • Willkommen im Zend Framework Forum

    ZF1 Zend Framework 1 + ZF2 Zend Framework 2

    Das Zend Framework Forum ist seit 2006 die erste Anlaufstelle für Zend Framework Entwickler in Deutschland. Mit über 70.000 Beiträgen und einer steigenden Nutzerzahl bietet das Forum hilfreiche Themen und ZF-Tutorials für professionelle Entwickler, fortgeschrittene Programmierer sowie Zend Framework Einsteiger.
    Wenn dies Dein erster Besuch in der Zend Framework Community ist, lies bitte zuerst die Hilfe - FAQ durch. Du musst Dich registrieren, bevor Du Beiträge verfassen kannst. Klicke oben auf 'Registrieren', um die Registrierung zu starten. Du kannst auch jetzt schon Beiträge lesen. Hier im Forum findest Du die Zend Framework Hilfe, die Du suchst!

    Grüße an alle Zend Framework Entwickler. Das Team vom Zend Framework Forum!

    Drupal Agentur

Zend Lucene (ZendSearch) und Wort-highlighting

Powers

New member
Hallo in die Runde.

Seit gestern arbeite ich mit der Lucene-PHP-Kopie für das ZF2:
https://github.com/zendframework/ZendSearch

Klappt auch alles wunderbar, bin praktisch schon am Ziel. Wenn da nicht die Sache mit dem Syntax Highlighter wäre, der aus mir unbekannten Gründen die Wörter zwar findet, aber dann leicht verschoben highlightet.

Und zwar gebe ich folgend das Suchwort in den QueryParser:
PHP:
$suchwort = 'suchwort';
$query = ZendSearch\Search\QueryParser::parse($suchwort);
Im View folgt grob dann nurnoch folgender Aufruf, um beliebigen Content mit dem oben gesetzten Suchwort highlighten zu lassen:
PHP:
$query->highlightMatches($searchResult->text);
Technisch gesehen wird das gesuchte Wort in den hereingegebenen Texten dann nur mit einem Tag umgeben. Standardmäßig dann so (gleich mitsamt dem angesprochenen Fehler):
PHP:
Suc<b style="color:black;background-color:#66ffff">hwort ka</b>
Und so zieht sich das durch die Texte. Mal ist nur der Anfangsbuchstabe des Wortes nicht im highlighting-Tag, manchmal landet der Tag sogar komplett auf einem benachbartem Wort.

Ich weiß das ZendSearch keine stable-Status hat, dennoch habe ich es mir gezogen. Dies ist nun der erste Issue der mir begegnet und in den ZendSearch-Klassen kann ich den Fehler dazu nicht erkennen.

Hat da vielleicht zufällig jemand Erfahrungswerte, speziell mit Suche / Indexieren? Auch die Befürchtung, dass HTML-Tags im Dokumententext zu diesen highlight-verschiebungen führt, hat sich nicht bewahrheitet. Stehe da nun leider allmählich auf dem Schlauch, wo es da intern wirklich kracht und was da typische Fehlerquellen sein könnten.
 

Powers

New member
Update: Eines kann soweit schonmal sagen: Mein Problem sind definitiv die Umlaute "äüö" und vermutlich ggf auch "ß" im Text. Mit jedem Vorkommen eines Umlautes im Text verschiebt sich das anschließende Highlighting um genau eine Stelle. Die im Text enthaltenen HTML-Tags stellen hingegen kein Problem dar.

Meine Basis ist bislang durchgänig UTF-8. Daher macht es auch keinen Unterschied, wenn ich "UTF-8" beim Aufruf der Lucene Funktion "highlightMatches" nochmal zusätzlich setze.
Auch die Datensätze in meiner MySql-Tabelle (Kollation: utf8_general_ci) sind entsprechend geformt.

Hinweis: Bei der Suche selbst funktionieren Umlaute tadellos!
 
Zuletzt bearbeitet:
Oben