Monday, October 24, 2016

Apache lucene - welcome to apache lucene , lucenzo






+

Bienvenido a Apache Lucene El proyecto Apache Lucene TM desarrolla software de búsqueda de código abierto, incluyendo: Lucene Core. nuestra sub-proyecto estrella, ofrece la indexación basada en Java y la tecnología de búsqueda, así como la corrección ortográfica, destacando golpeado y capacidades de análisis / tokenización avanzadas. Solr TM es un servidor de búsqueda de alto rendimiento construido utilizando Lucene Core, con XML / HTTP y JSON API / Python / Ruby, destacando golpeado, búsqueda facetada, el almacenamiento en caché, replicación, y un interfaz de administración web. PyLucene es un puerto del pitón del proyecto Core. Lucene TM Noticias y párrafo; 09 de septiembre de 2016 - Apache Lucene 5.5.3 y Apache Solr 5.5.3 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 5.5.3 y 5.5.3 de Apache Solr Ambas versiones contienen una serie de correcciones de errores. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 25 de de agosto de 2016 - Apache Lucene 6.2.0 y Apache Solr 6.2.0 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 6.2.0 y Apache Solr 6.2.0. Aspectos destacados de esta versión Lucene incluyen: & párrafo; La bandera CREATE_NEW se pasa al crear un archivo para asegurarse de Lucene es realmente una sola escritura Índice de rangos numéricos (min y max de valor en un solo campo) y de búsqueda por rango de superposición IndexWriter métodos devuelven un número de secuencia que indica el fin efectivo de operaciones a través de las discusiones UkrainianMorfologikAnalyzer es un nuevo analizador basado en Inglés para la lengua ucraniana La clase Polygon ahora puede crearse a partir de una cadena GeoJSON Compuesto de creación de archivos ahora verifica la suma de comprobación de sus archivos de componentes Índice de tiempo de clasificación es ahora una característica principal, y es compatible con los puntos dimensionales StandardAnalyzer se trasladó a núcleo y es el analizador por defecto MatchNoDocsQuery incluye ahora la razón por la que fue creado QueryParser ahora se puede decir que no pre-fraccionamiento, el espacio en blanco MMapDirectory se esfuerza más para evitar SIGSEGV código erróneo si intenta ejecutar búsquedas después de que el índice estaba cerrado, pero sigue siendo el mejor esfuerzo MMapDirectory ya no se asigna referencias débiles para facilitar la recolección de basura Conjunción (MUST), filtro de consultas son más rápidos puntos dimensionales tienen mucho más rápido ( 40%) tiempo de descarga y utilizar menos espacio en el índice Aspectos destacados de esta versión de Solr incluyen: & párrafo; DocValues, streaming / exportación, aprendizaje automático DocValues ​​ahora se pueden utilizar con BoolFields Fecha y apoyo booleano añadido al manejador / exportación Añadir "scoreNodes" streaming de expresión gráfica Apoyar ETL paralelo con el "tema" de expresión La selección de características y la regresión logística en el texto a través de nuevas expresiones de streaming: "características" y "tren" Añadir soporte básico de autenticación para el script bin / Solr las operaciones de archivos a / desde Zookeeper ahora son compatibles Nueva etiqueta de "papel" en las reglas de colocación de réplica, por ejemplo, = descartar papel: supervisor mantiene repicas nuevos nodos fuera capataz CDRR: caer de nuevo a la replicación de todo el índice cuando Tlogs son insuficientes Nuevo comando REPLACENODE dar de baja un nodo existente y sustituirlo por otro nuevo nodo DELETENODE nuevo comando para borrar todas las réplicas en un nodo Añadir Kerberos delegación apoyo simbólico Soporte suplantación seguro / usuario de proxy para la autenticación Kerberos Un gran número de regresiones fueron fijadas en la nueva interfaz de usuario de administración Nuevas consultas booleanas función de comparación comparando argumentos numéricos: GT, GTE, lt, LTE, eq Extracción del módulo de Apache Tika actualizado a 1.13. Se ha actualizado a 2.7.2 Hadoop Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 25 de de junio de 2016 - Apache Lucene 5.5.2 y 5.5.2 de Apache Solr y disponible para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 5.5.2 y 5.5.2 de Apache Solr Ambas versiones contienen una serie de correcciones de errores. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 17 de de junio de 2016 - Apache Lucene 6.1.0 y Apache Solr 6.1.0 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 6.1.0 y Apache Solr 6.1.0. Aspectos destacados de esta versión Lucene incluyen: & párrafo; Numerosas mejoras en LatLonPoint, para la indexación de un punto de latitud / longitud y la búsqueda por polígono, la distancia o caja, o la búsqueda de los vecinos más cercanos Geo3D ahora tiene APIs sencillas para la creación de consultas de forma común, a juego LatLonPoint Más rápido de indexación y búsqueda de puntos. geo-espacial más rápida indexación y búsqueda de LatLonPoint, Geo3D y GeoPoint (véase http://home. apache. org/ HardlinkCopyDirectoryWrapper optimiza las copias de archivos utilizando los enlaces duros En caso de controversia, la caché de consultas ahora prefiere devolver un anotador no está en caché en lugar de esperar en un bloqueo. Aspectos destacados de esta versión de Solr incluyen: & párrafo; Se ha añadido soporte gráfico de recorrido, y la nueva "especie" y expresiones de streaming "al azar". También es ahora posible crear expresiones de streaming con la interfaz de usuario Admin Solr. Fija el método de facetado ENUM para no volver a escribir innecesariamente al FCS, que estaba causando una ralentización. Menor creación de la basura al crear entradas de caché. Nuevo transformador documento [subconsulta] para obtatin documentos relacionados por resultado doc. EmbeddedSolrServer asigna montón mucho más sabiamente, incluso con lista de documentos en blanco sin devoluciones de llamada. Nueva escritor respuesta GeoJSON para la codificación de los datos geográficos en las respuestas de consultas. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 28 de de mayo de 2016 - Apache Lucene 6.0.1 y Apache Solr 6.0.1 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 6.0.1 y 6.0.1 de Apache Solr Ambas versiones contienen una serie de correcciones de errores. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 5 de mayo de 2016 - Apache Lucene 5.5.1 y Apache Solr 5.5.1 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 5.5.1 y 5.5.1 de Apache Solr Ambas versiones contienen una serie de correcciones de errores. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 8 de abril de 2016 - Apache Lucene 6.0.0 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 6.0.0 y 6.0.0 de Apache Solr Aspectos destacados de esta versión Lucene incluyen: & párrafo; Java 8 es la versión mínima necesaria de Java. puntos dimensionales, en sustitución de los campos numéricos existentes, proporciona soporte técnico rápido y eficiente con el espacio, tanto para gama y la forma de filtrado de una o varias dimensiones. Esto incluye numérica (int, float, larga, doble), InetAddress, BigInteger y filtrado gama binaria, así como la búsqueda de forma geo-espacial sobre LatLonPoints 2D indexados. Ver esta entrada del blog para más detalles. clases y módulos dependientes (por ejemplo, MemoryIndex, Estrategias espacial, Ingreso módulo) se han rediseñado para utilizar nuevos tipos de puntos. módulo de clasificación Lucene ahora funciona en los documentos de Lucene utilizando un KNearestNeighborClassifier o SimpleNaiveBayesClassifier. El módulo espacial ya no depende de bibliotecas de terceros. clases espaciales anteriores se han trasladado a un nuevo módulo espacial-extras. Spatial4j se ha actualizado a una nueva versión 0.6 organizado por locationtech. TermsQuery aumento de rendimiento por una política de caché por defecto más agresivo. Por omisión de IndexSearcher Similitud ahora se cambia a BM25Similarity. método más fácil de definir personalizados casos CharTokenizer. Aspectos destacados de esta versión de Solr incluyen: & párrafo; Mejora de los valores predeterminados para "similitud" se utiliza en Solr, con el fin de proporcionar una mejor experiencia por defecto para los nuevos usuarios. Mejorados por defecto "similitud" de actualización de los usuarios: DefaultSimilarityFactory se ha eliminado, por defecto implícito Similitud se ha cambiado a SchemaSimilarityFactory, y SchemaSimilarityFactory se ha modificado para utilizar BM25Similarity como valor predeterminado para tipos de campo que no declaran explícitamente una similitud. métodos GET en desuso para el esquema son ahora accesibles a través de la API a granel. La salida tiene menos detalles y no es compatible con versiones anteriores. Los usuarios deben configurar useDocValuesAsStored = orden "falsa" para preservar la especie en los campos de varios valores que se han almacenado tanto = "true" y docValues ​​= "true". Con formato de fecha veces son más consistentes con la norma ISO-8601. fechas BC ahora están mejor soportados, ya que ahora se formatean con un líder '-'. AD años posteriores a 9999 tienen un líder '+'. excepciones de análisis sintáctico se han mejorado. Desuso SolrServer y subclases se han eliminado, utilizar SolrClient lugar. La configuración en desuso en solrconfig. xml se ha eliminado. Los usuarios deben sacarlo de solrconfig. xml. SolrClient. shutdown () se ha eliminado, utilice SolrClient. close () en su lugar. El elemento zkCredientialsProvider en desuso en la sección de solrcloud solr. xml ahora se retira. Usar la ortografía correcta (zkCredentialsProvider) en su lugar. Se ha añadido soporte para ejecutar consultas SQL en paralelo a través de colecciones SolrCloud. Incluye soporte StreamExpression y un nuevo controlador JDBC para la interfaz SQL. Las nuevas características y capacidades añadidas a la API de streaming. Se ha añadido soporte para las consultas SELECT DISTINCT a la interfaz SQL. Nueva GraphQuery para habilitar recorrido del grafo como un operador de consulta. El nuevo soporte para la replicación Cruz Centro de Datos que consiste en la replicación activa / pasiva para SolrClouds separados alojados en centros de datos independientes. soporte del filtro de añadir para obtener en tiempo real. soporte de la columna de alias agregado a la interfaz SQL paralelo. Nuevo comando añadido para cambiar entre el modo de no / seguro en el cuidador del zoológico. Ahora es posible utilizar fragmentos IP en reglas de colocación de réplicas. 22 de de febrero de 2016 - Apache Lucene 5.5.0 y Apache Solr 5.5.0 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 5.5.0 y 5.5.0 de Apache Solr Aspectos destacados de esta versión Lucene incluyen: & párrafo; JoinUtil. createJoinQuery ahora puede unirse en campos numéricos valores doc BlendedInfixSuggester tiene ahora un modelo de calificación recíproca exponencial, para favorecer más fuertemente sugerencias con partidos más cerca del comienzo CustomAnalyzer ha mejorado (tiempo de compilación) tipo de seguridad DFISimilarity implementa la divergencia del modelo de calificación de la independencia envuelva totalmente cualquier otra política de combinación usando MergePolicyWrapper consultas puntuales caja de arena geo se han graduado en el módulo espacial, y ahora utilizar una codificación más eficiente binaria plazo para el tamaño del índice más pequeño, más rápido de indexación, y la disminución de uso del montón de búsqueda en tiempo BooleanQuery realiza algunas nuevas optimizaciones de consulta TermsQuery constructores son más eficientes GC Aspectos destacados de esta versión de Solr incluyen: & párrafo; La versión de esquema se ha aumentado a 1,6, y Solr ahora devuelve valores campos no-doc almacenado junto con los campos almacenados La acción PERSISTIR CoreAdmin se ha eliminado El elemento mergePolicy está en desuso en favor de un elemento mergePolicyFactory similares, en solrconfig. xml CheckIndex ahora funciona en HdfsDirectory RuleBasedAuthorizationPlugin ahora permite comodines en el papel, y acepta un 'todo' el permiso Ahora los usuarios pueden elegir el modo de compresión en SchemaCodecFactory Solr soporta ahora XMLQueryParser de Lucene Colecciones API ahora tienen soporte asíncrono facetado campo no invertida se vuelve a activar, para un mayor rendimiento en los índices rara vez cambian 23 de de enero de 2016 - Apache Lucene 5.3.2 y Apache Solr 5.3.2 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 5.3.2 y 5.3.2 de Apache Solr Ambas versiones contienen una serie de correcciones de errores. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 23 de de enero de 2016 - Apache Lucene 5.4.1 y Apache Solr 5.4.1 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 5.4.1 y 5.4.1 de Apache Solr Este comunicado contiene una solución importante para un error de corrupción que se introdujo en la versión 5.4.0. Si se encuentra en 5.4.0 y usando valores binarios, los valores doc SORTED_NUMERIC o SORTED_SET, la actualización a 5.4.1 se recomienda encarecidamente. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 14 de de diciembre de el año 2015 - Apache Lucene 5.4.0 y Apache Solr 5.4.0 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 5.4.0 y 5.4.0 de Apache Solr Aspectos destacados de esta versión Lucene incluyen: & párrafo; Cambios y párrafo API; Query. getBoost y Query. setBoost están en desuso en favor de la nueva BoostQuery La clase de filtro está en desuso en favor de las cláusulas de filtro en una BooleanQuery DefaultSimilarity ha sido renombrado a ClassicSimilarity para prepararse para el traslado a BM25 en Lucene 6 Las nuevas características y para; Nuevo filtro de contadores de Serbia Nueva DecimalDigitFilter, a veces dígitos Unicode a dígitos latino Nueva UnicodeWhitespaceTokenizer, que utiliza la definición de los espacios en blanco Unicode y se divide en NBSP Nueva GeoPointDistanceRangeQuery para buscar puntos geográficos dentro de un anillo almacenamiento en caché está habilitado por defecto en IndexSearcher, utilice IndexSearcher. setQueryCache (nulo) para desactivar Optimizaciones y para; MatchAllDocsQuery ahora más rápida valores de Doc ahora utilizan menos memoria para los campos de valores múltiples y menos del disco en caso de campos dispersos iteradores de dos fases consiguieron un API coste partido de modo que los bits costosos se pueden comprobar última correcciones y para Bug; PatternTokenizer ya no se cuelga en el montón dimensionado para la cadena de entrada máxima que jamás haya visto. Aspectos destacados de esta versión de Solr incluyen: & párrafo; Los cambios de interfaz de usuario y para; El rearchitected interfaz de administración está ahora vinculado a un lugar destacado de la interfaz de usuario existente, e incluye soporte para la gestión de colecciones, así como la creación y la eliminación de los campos a través de la ficha esquema. Esperamos que sea por defecto en la próxima versión. Características y API párrafo; Nuevas Colecciones API para migrar de clusterstate. json a state. json per-recolección y forzar la elección de un líder cuando todas las réplicas en un fragmento están abajo. Una nueva API de gestión configset se ha añadido. Características y consultar párrafo; caché del filtro es ahora accesible a través de una sintaxis de las consultas Solr. ScoreJoins ahora puede referirse a una colección de un solo fragmentados que se replica en todos los nodos. Añadir soporte impulso, y 'excluir el documento consultado' en MoreLikeThis QParser. Añadir una 'especie' param local al colapso QParser para apoyar el uso de las opciones de orden complejas para seleccionar el doc representitive para cada grupo colapsado. Otras características y Pará; SolrJ ahora tiene soporte para la conexión a Solr mediante la autenticación básica. que sugirieron que analizan ahora pueden filtrar las sugerencias de un campo de contexto. JSON faceta API: añadir "método" param facetas de términos / de campo para dar un toque de ejecución de qué método se debe utilizar para faceta. CloneFieldUpdateProcessorFactory ahora es compatible con la elección de un "destino" nombre de campo basado en un patrón de expresión y las opciones de reemplazo de inicio. Proporcionar soporte de herramientas de contexto enchufable para VelocityResponseWriter. 24 de de septiembre de el año 2015 - Apache Lucene 5.3.1 y Apache Solr 5.3.1 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 5.3.1 y 5.3.1 de Apache Solr Aspectos destacados de esta versión Lucene incluyen: & párrafo; Corrección de errores y para; Retire corte del cargador de clases en MorfologikFilter UsageTrackingQueryCachingPolicy ya no se almacena en caché las consultas triviales como MatchAllDocsQuery BoostingQuery fija para volver a escribir las consultas envueltos Aspectos destacados de esta versión de Solr incluyen: & párrafo; Corrección de errores y para; security. json no se carga en el inicio del servidor Plugin de RuleBasedAuthorization no funciona para la autorización de recogida-admin-edit plantilla VelocityResponseWriter tema de codificación. Las plantillas deben ser codificación UTF-8 SimplePostTool (también bin / post) - filetypes "*" ahora funciona correctamente en el modo 'Web' Ejemplo / archivos de actualización-script. js sean Java 7 y 8 compatibles. SolrJ no podía hacer peticiones a los manipuladores con '/ / admin' prefijo El uso de filtros timeAllowed puede causar incompletas para almacenar en caché y resultados incorrectos para ser devuelto en las solicitudes posteriores $ Resource. get de VelocityResponseWriter (clave, baseName, la configuración regional) para utilizar la configuración regional especificada. Resolver la cuestión XSS en la interfaz de usuario de administración de las estadísticas de la página 24 de de agosto de el año 2015 - Apache Lucene 5.3.0 y Apache Solr 5.3.0 disponible y para; El PMC Lucene se complace en anunciar la disponibilidad de Apache Lucene 5.3.0 y Apache Solr 5.3.0. Aspectos destacados de esta versión Lucene incluyen: & párrafo; Cambios y párrafo API; PhraseQuery y BooleanQuery ahora son inmutables Las nuevas características y para; Se ha añadido una nueva clase org. apache. lucene. search. join. CheckJoinIndex que se puede utilizar para validar que un índice tiene una estructura adecuada para ejecutar consultas de unión Se ha añadido una nueva BlendedTermQuery para mezclar las estadísticas a través de varios términos Nueva API común sugieren que refleja las API Query / IndexSearcher de Lucene para suggester basado documento. IndexWriter ahora se puede inicializar de un tiempo casi real ya abierto o el lector no NRT Añadir árbol rango experimental formato y consultas de valores doc, basado en una versión 1D del árbol BKD espacial, por una alternativa más rápida y más pequeño para el filtrado término numérico y binario basado en mensajes. Rango árboles también pueden manejar valores de más de 64 bits. características y mejoras y para geo-relacionados; Agregado GeoPointField, GeoPointInBBoxQuery, GeoPointInPolygonQuery de simple "punto Lat / Long indexada en Bbox / forma de" búsqueda Añadido experimental BKD árbol geoespacial formato y consultas de valores doc, para una rápida "Bbox / polígono contiene puntos lat / lon" Utilice valores doc de post-filtro GeoPointField golpes que caída en las células de frontera, lo que resulta en menor índice, búsquedas más rápidas y menos del montón utilizado para cada consulta Optimizaciones y para; Reducir el uso de memoria RAM de FieldInfos, y acelerar las operaciones de búsqueda por número, mediante el uso de una matriz en lugar de TreeMap excepto en casos muy escasos Faster intersección de los términos del diccionario con autómatas muy finito, que se puede generar por ejemplo. por las consultas de expresiones regulares simples Varias correcciones de errores y optimizaciones desde el lanzamiento 5.2.0. Aspectos destacados de esta versión de Solr incluyen: & párrafo; Además de muchas otras mejoras en el marco de seguridad, Solr incluye ahora una AuthenticationPlugin implementación de autenticación básica de HTTP que almacena las credenciales de forma segura en ZooKeeper. Esta es una forma sencilla de requerir un nombre de usuario y una contraseña para acceder a cualquier pantalla o las API de administración de Solr. En AuthorizationPlugin construido que proporciona un control fino sobre la aplicación de las ACL para varios recursos con reglas permisssion que se almacenan en ZooKeeper. La API JSON faceta ahora puede cambiar el dominio de los comandos de facetas, haciendo esencialmente un bloque de unirse y pasar de padres a hijos, o hijos a los padres antes de calcular los datos de faceta. Importantes mejoras en el rendimiento de la nueva API de la faceta de módulo / JSON faceta. Facetas de la consulta y el rango bajo de pivote facetas. Al igual que la API JSON faceta, facetas de pivote puede anidar cómo otros tipos de facetas como el rango de consulta y facetas. Más de esto las opciones de consulta del Analizador. El MoreLikeThis QParser ahora es compatible con todas las opciones proporcionadas por el controlador de MLT. El analizador de consulta es mucho más versátil que el controlador de como funciona en el modo de nube, así como en cualquier lugar una consulta normal puede ser especificado. Agregado soporte para la API de esquema en SolrJ modo de puntuación añadido para consulta de tiempo de unión y el bloque de unirse. formato de respuesta de la sonrisa añadido Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 15 de de junio de el año 2015 - Apache Lucene 5.2.1 y Apache Solr 5.2.1 disponible y para; El PMC Lucene se complace en anunciar el lanzamiento de Apache Lucene 5.2.1 y 5.2.1 de Apache Solr Aspectos destacados de esta versión Lucene incluyen: & párrafo; Fijar la clase de carga estancamiento relativo a la inicialización Codec, códec predeterminado y el descubrimiento de SPI. NRT lectores reflejan ahora un nuevo commit incluso si no hay ningún cambio en los datos de usuario cometer Consultas Get a semejanza simulado cuando no se necesitan las puntuaciones con el fin de no cargar la información innecesaria como normas Aspectos destacados de esta versión de Solr incluyen: & párrafo; Fijar javascript error introducido por la SOLR-7409 que rompe la pantalla dataimport en la interfaz de usuario de administración Tallar en un campo numérico con una función única subfacet () en otro campo numérico puede dar lugar a resultados incorrectos o una excepción Nuevo módulo de faceta debe respetar shards. tolerant y procesar todos los fragmentos no fallar en lugar de lanzar una excepción Una petición con un tipo de contenido JSON, pero ningún cuerpo provocó una excepción de puntero nulo SolrOutputFormat crea una solr. xml no válida en el zip casa Solr para MapReduceIndexerTool Coloque un nuevo panel de administración de interfaz de usuario de la nube (basado en angular) El DefaultSolrHighlighter desde 5.0 fue determinar si estaban presentes cargas útiles de una manera que era lento, especialmente cuando se pusieron de relieve una gran cantidad de campos. Ahora es rápida Las solicitudes no se distribuyen de manera uniforme si la colección no está presente de forma local Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 7 de junio de el año 2015 - Apache Lucene 5.2.0 y Apache Solr 5.2.0 disponible y para; El PMC Lucene se complace en anunciar la disponibilidad de Apache Lucene 5.2.0 y Apache Solr 5.2.0. Aspectos destacados de esta versión Lucene incluyen: & párrafo; Consultas por rango comparten ahora el documento conjuntamente / código de intersección con consultas booleanas, y el uso de los iteradores de dos fases para la intersección más rápido, evitando posiciones de carga en ciertos casos. Se ha añadido soporte de dos fases para SpanNotQuery, y SpanPositionCheckQuery y sus subclases: SpanPositionRangeQuery, SpanPayloadCheckQuery, SpanNearPayloadCheckQuery, SpanFirstQuery. Se ha añadido un nuevo tiempo de consulta se unen para unirse al módulo que utiliza ordinales globales, lo que es más rápido para su posterior uniones entre reabre. Nueva CompositeSpatialStrategy combina velocidad de la RPT con una precisión de SDV. Incluye optimizado predicado Intersección de evitar los numerosos controles de geometría. Usos TwoPhaseIterator. Nueva LimitTokenOffsetFilter que limita a los tokens antes de un máximo inicial configurada offset. New PackedQuadPrefixTree espacial, una elección general más eficientes que QuadPrefixTree, especialmente para formas de alta precisión. Cuando se utiliza, por lo general usted debe desactivar la opción de pruneLeafyBranches RPT. Expresiones ahora soportan claves de enlaces que se parecen a las funciones arg cero Añadir SpanWithinQuery y SpanContainingQuery que volver palmos dentro de / que contienen otros tramos. Nueva API espacial "Geo3D" con la integración Spatial4j parcial. Es un conjunto de formas implementadas utilizando la geometría planar 3D para el cálculo de las relaciones espaciales en la superficie de una esfera. Las formas incluyen Point, BBox, círculo, ruta (cadena búfer de línea), y Polígono. Varias correcciones de errores y optimizaciones desde el lanzamiento 5.1.0. Aspectos destacados de esta versión de Solr incluyen: & párrafo; Restaurar API permite la restauración de un núcleo de una copia de seguridad de índice. único () ahora se implementa para los campos numéricos y de fecha forma más plana opcional a través de un parámetro "tipo" Se ha añadido soporte para el parámetro "mincount" en facetas alcance para suprimir cubos en menor medida que el recuento Selección múltiple facetas apoyo para el módulo de faceta a través del parámetro "excludeTags", que no tiene en cuenta ninguna coincidencia etiquetada filtros para esa faceta. HLL () la función de las facetas de cardinalidad distribuidas a través de algoritmo HyperLogLog. Véanse los ejemplos en http://yonik. com/solr-count-distinct/ Un nuevo parámetro "facet. range. method" para que los usuarios elijan cómo hacer facetado rango entre una implementación basada en filtros (algoritmo anterior, el uso de "facet. range. method = filtro") o DocValues ​​( "facet. range. method = dv ") Basada en reglas de asignación de réplica durante la recolección, casco, y la creación de la réplica. Nueva opción de 'cardinalidad' para stats. field, utiliza HyperLogLog para estimar de manera eficiente la cardinalidad de un campo w / delimitada RAM. Blog post: https://lucidworks. com/blog/hyperloglog-field-value-cardinality-stats/ stats. field ahora es compatible con params locales individuales para 'CountDistinct' y '' distinctValues. 'Calcdistinct' aún se puede utilizar como un alias para ambas opciones. Se han añadido autenticación y autorización marcos que definen las interfaces y mecanismos para crear, cargar y usar complementos de autorización / autenticación. Un plugin de autenticación Kerberos que permitiría ejecutar una configuración de Kerberos Solr. Solr Transmisión Expresiones Ver https://cwiki. apache. org/confluence/display/solr/Streaming+Expressions bin / post (y SimplePostTool en - Dauto = yes modo) envía ahora en lugar de archivos brinca sin un tipo de contenido conocido, como "application / octet-stream", a condición de que todavía está en los tipos de archivos permitidos de ajuste. HDFS factor de replicación de registro de transacciones es ahora configurable Una propiedad en todo el clúster puede ahora ser añadido / editar / borrar mediante el script zkcli y no requiere de una instancia de Solr corriendo. Nueva RptWithGeometrySpatialField espacial, basado en CompositeSpatialStrategy, que combina los índices de RPT para la velocidad con la geometría serializado para la exactitud. Incluye un segmento basado en Lucene caché en memoria de forma. Refactorizamos interfaz de administración usando AngularJS. No es el valor por defecto, sino una interfaz de interfaz de usuario en paralelo en esta versión. Solr internamente se ha actualizado a utilizar embarcadero 9. Ambas versiones contienen una serie de nuevas características, correcciones de errores y optimizaciones. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 14 de de abril de el año 2015 - Apache Lucene 5.1.0 y Apache Solr 5.1.0 disponible y para; El PMC Lucene se complace en anunciar la disponibilidad de Apache Lucene 5.1.0 y Apache Solr 5.1.0. Ambas versiones contienen una serie de nuevas características, correcciones de errores y optimizaciones. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 5 de marzo de el año 2015 - Apache Lucene 4.10.4 y 4.10.4 Apache Solr y disponible para; El PMC Lucene se complace en anunciar la disponibilidad de Apache Lucene 4.10.4 y 4.10.4 Apache Solr. Ambas versiones contienen una serie de correcciones de errores. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. 20 de febrero de el año 2015 - Apache Lucene 5.0.0 y Apache Solr 5.0.0 disponible y para; El PMC Lucene se complace en anunciar la disponibilidad de Apache Lucene 5.0.0 y Apache Solr 5.0.0. Consulte los archivos de Lucene y Solr changes. txt changes. txt incluidos con la liberación para obtener una lista completa de los detalles. Aspectos destacados de la liberación Lucene incluyen: & párrafo; Más fuerte de seguridad de índice Todo el acceso a archivos ahora utiliza las API de Java NIO.2 que dan Lucene índice de seguridad más fuerte en términos de una mejor gestión de errores y compromete más seguras. Cada segmento de Lucene ahora almacena un identificador único por segmento y por cada confirmación para ayudar en la réplica exacta de los archivos de índice. Durante la fusión, IndexWriter ahora siempre comprueba los segmentos entrantes para la corrupción antes de la fusión. Esto puede significar, sobre la actualización a 5.0.0, que se fusionan podrán descubrir desde hace mucho tiempo la corrupción latente en un índice 4.x mayor. Reducción del uso del montón Lucene soporta ahora al azar-grabables y bitsets escaso poder-anticipadas (RoaringDocIdSet y SparseFixedBitSet), por lo que el montón es requerido en proporción a cómo se establecen muchos bits, no cómo existen muchos documentos en total en el índice. el uso del montón durante IndexWriter fusión es también mucho menor con el nuevo Lucene50Codec, ya que los valores doc y normas para los segmentos que se pueden fusionar ya no están totalmente cargadas en el montón para todos los campos; Ahora que se cargan por el campo que actualmente se fusionaron, y luego cayeron. El formato de las normas predeterminadas ahora utiliza la codificación dispersa en su caso, por lo que los índices que permiten las normas para muchos campos dispersos verán una gran reducción en el montón requerido en el momento de búsqueda. 5.0 tiene una nueva API para imprimir una estructura de árbol que muestra un desglose recursiva de los cuales las partes están utilizando la cantidad de almacenamiento dinámico. FieldCache se ha ido (trasladado a un UninvertingReader dedicado en el módulo de misceláneos). Esto significa que cuando usted tiene la intención de ordenar en un campo, se debe indexar ese campo utilizando los valores doc, que es mucho más rápido y consume menos montón de FieldCache. Tokenizers y analizadores ya no requieren Reader en init. NormsFormat ahora tiene su propio dedicado NormsConsumer / Productor SortedSetSortField, que se utiliza para ordenar en un campo de valor múltiple, se promueve de caja de arena al núcleo de Lucene. PostingsFormat ahora utiliza una API "pull" al escribir las publicaciones, al igual que los valores doc. Esto es de gran alcance, ya que puede hacer las cosas en su formato de publicación que exijan efectuar más de una pasada a través de las publicaciones tales como la iteración en las publicaciones para cada término para decidir qué formato de compresión que debe utilizar. Nuevo tipo DateRangeField permite la indexación y búsqueda de intervalos de tiempo, en particular las de varios valores. Un nuevo ExitableDirectoryReader extiende FilterDirectoryReader y permite salir de las solicitudes que tengan demasiado largo enumerar más de términos. Que sugirieron desde el campo de valor múltiple ahora se pueden construir como DocumentDictionary ahora enumera cada valor por separado en un campo de valor múltiple. ConcurrentMergeScheduler detecta si el índice está en SSD o no, y hace un mejor trabajo impago su configuración. Esto sólo funciona en Linux por ahora; otros sistemas operativos continuarán utilizando los valores predeterminados anteriores (en sintonía para discos giratorios). Auto-IO-estrangulación ha sido añadido a ConcurrentMergeScheduler, para limitar la velocidad IO escribe para cada combinación dependiendo de la tasa de mezcla entrante. CustomAnalyzer ha añadido que permite configurar los analizadores como lo hace en el esquema de índice de Solr. Esta clase tiene un constructor de API para configurar Tokenizers, TokenFilters y CharFilters en base a sus nombres y parámetros SPI según lo documentado por las fábricas correspondientes. índice de la memoria ahora es compatible con cargas útiles. Se ha añadido una caché de filtro con una política de seguimiento del uso que se almacena en caché los filtros basados ​​en la frecuencia de uso. El codec por defecto tiene una opción para controlar BEST_SPEED o BEST_COMPRESSION para los campos almacenados. campos almacenados se fusionan de manera más eficiente, sobre todo cuando la actualización de versiones anteriores o el uso de SortingMergePolicy Aspectos destacados de la liberación Solr incluyen: & párrafo; mejoras de usabilidad que incluyen secuencias de comandos bin mejoradas y ejemplos nuevos y reestructurados. Secuencias de comandos de apoyo a la instalación y ejecución de Solr como un servicio en Linux. Distribuido FDI es ahora compatible y se puede activar a través de la configuración. Actualmente, hay cuatro implementaciones compatibles para el mismo: LocalStatsCache: Estadísticas documento local. ExactStatsCache: Un tiempo de agrupación uso ExactSharedStatsCache: Estadísticas compartidos a través de las solicitudes LRUStatsCache: Estadísticas compartida en una caché LRU en las solicitudes Solr ya no se envía un archivo de la guerra y en lugar de ser una aplicación descargable. SolrJ ahora tiene soporte de primera clase para la API de colecciones. registro implícito de la replicación, obtener y manipuladores de administración. Config API que soporta paramsets para configurar fácilmente los parámetros Solr y la configuración de campos. Esta API también es compatible con la gestión de los controladores de solicitudes de pre-existentes y la edición solrconfig. xml común a través de la superposición. API para la gestión de las gotas permite la carga de solicitud de frascos de controlador y el registro de ellos a través de la API de configuración. API Colección BALANCESHARDUNIQUE que permite una distribución uniforme de las propiedades de réplica personalizado. Ahora hay una opción para no mezclar las conjuntoNodos proporcionado durante la creación de la colección. Opción para configurar el ancho de banda en handler de replicación para evitar que el uso de todo el ancho de banda. La división de clusterstate a la colección per permite mejorar la escalabilidad en SolrCloud. Este es también el formato predeterminado para las nuevas colecciones que se crearían en el futuro. timeAllowed ahora se utiliza para terminar prematuramente solicitudes durante la expansión de consultas y SolrClient reintento de solicitud. pivot. facet resultados pueden ahora incluir los resultados stats. field limitadas por esos pivotes anidado. stats. field se puede utilizar para generar las estadísticas a través de los resultados de las funciones numéricas arbitrarias. También permite solicitar para las estadísticas de las facetas de pivote usando etiquetas. Un nuevo DateRangeField se ha añadido para los intervalos de fechas de indexación, especialmente los de varios valores. campos espaciales que antes requerían unidades = grados ahora toman distanceUnits = grados / kilómetros millas en su lugar. MoreLikeThis analizador de consultas permite solicitar documentos similares a un documento existente y también trabaja en el modo SolrCloud. Transacción estado de reproducción del registro ahora se registra protocolización opcional de las solicitudes lentas. 29 de de diciembre de 2014 - Apache Lucene 4.10.3 y 4.10.3 Apache Solr y disponible para; La Apache Software Foundation y para; La Apache Software Foundation proporciona apoyo a la comunidad Apache de proyectos de software de código abierto. Los proyectos de Apache se definen por procesos basados ​​en el consenso de colaboración, una licencia de software pragmática abierta y un deseo de crear un software de alta calidad que está a la vanguardia en su campo. Apache Lucene, Apache Solr, Apache PyLucene, Apache Proyecto Relevancia abierto y sus respectivos logotipos son marcas registradas de The Apache Software Foundation. Todas las demás marcas mencionadas pueden ser marcas comerciales o marcas comerciales registradas de sus respectivos propietarios. de Apache Lucene 6.2.0 Acerca e párrafo; enlaces y para ASF; Proyectos y párrafo relacionado;




No comments:

Post a Comment