编程语言
首页 > 编程语言> > MarkLogic Wilcard搜索-QConsole与Java API

MarkLogic Wilcard搜索-QConsole与Java API

作者:互联网

我相信我从基于Java的查询中看到了不同的结果,并且我相信查询控制台中的cts:search是等效的.这里有很多信息,我试图适当地组织它.以下是设置简单示例来复制我所见内容的步骤.

>使用默认设置创建新数据库
>使用默认设置添加新林
>启用三个字符的搜索(仅非默认数据库设置)
>将下面的三个json文档插入数据库

查询控制台返回doc2. Java客户端返回doc2和doc1.为什么?我希望每个人都能得到相同的结果.我想获取查询控制台返回的Java结果.我用Java错误地编写了查询定义吗?

即使我已指定仅在给定的json属性(名称)内进行通配符搜索,看起来Java客户端通配符搜索仍在搜索整个文档.

给定客户端RawCombinedQueryDefinition,是否可以查看或记录生成的服务器端“ cts查询”?我想看看服务器端将Java请求转换成什么.

doc1.json

{
  "state": "OH",
  "city": "Dayton",
  "notes": "not Cincinnati"
}

doc2.json

{
  "state": "OH",
  "city": "Cincinnati",
  "notes": "real city"
}

doc3.json

{
  "state": "OH",
  "city": "Daytona",
  "notes": "this is a made up city"
}

用于插入文档的查询控制台代码

xquery version "1.0-ml"; 
xdmp:document-load("/some/path/doc1.json",
  <options xmlns="xdmp:document-load">
    <uri>/doc1.json</uri>
  </options>
); 

用于搜索的查询控制台代码

xquery version "1.0-ml";
cts:search(fn:collection(),
  cts:and-query((
    cts:json-property-value-query("state", "OH"),
    cts:json-property-value-query("city", "*Cincinnati*") 
  ))
)

Java QueryManager查询中易于阅读的文本

{
  "search": {
    "query": {
      "queries": [
        {
          "value-query": {
            "type": "string",
            "json-property": "state",
            "text": "OH"
          }
        },
        {
          "value-query": {
            "type": "string",
            "json-property": "city",
            "text": "*Cincinnati*"
          }
        }
      ]
    }
  }
}

Java代码

import com.marklogic.client.DatabaseClient;
import com.marklogic.client.DatabaseClientFactory;
import com.marklogic.client.document.DocumentPage;
import com.marklogic.client.document.DocumentRecord;
import com.marklogic.client.document.JSONDocumentManager;
import com.marklogic.client.io.Format;
import com.marklogic.client.io.StringHandle;
import com.marklogic.client.query.QueryManager;
import com.marklogic.client.query.RawCombinedQueryDefinition;
import org.junit.Test;

public class MarkLogicTest
{
    @Test
    public void testWildcardSearch()
    {
        DatabaseClientFactory.SecurityContext securityContext = new DatabaseClientFactory.DigestAuthContext("admin", "admin");
        DatabaseClient client = DatabaseClientFactory.newClient("localhost", 8000, "test", securityContext);
        QueryManager queryManager = client.newQueryManager();
        JSONDocumentManager documentManager = client.newJSONDocumentManager();

        String query = "{\n" +
                "  \"search\": {\n" +
                "    \"query\": {\n" +
                "      \"queries\": [\n" +
                "        {\n" +
                "          \"value-query\": {\n" +
                "            \"type\": \"string\",\n" +
                "            \"json-property\": \"state\",\n" +
                "            \"text\": \"OH\"\n" +
                "          }\n" +
                "        },\n" +
                "        {\n" +
                "          \"value-query\": {\n" +
                "            \"type\": \"string\",\n" +
                "            \"json-property\": \"city\",\n" +
                "            \"text\": \"*Cincinnati*\"\n" +
                "          }\n" +
                "        }\n" +
                "      ]\n" +
                "    }\n" +
                "  }\n" +
                "}";

        StringHandle queryHandle = new StringHandle(query).withFormat(Format.JSON);
        RawCombinedQueryDefinition queryDef = queryManager.newRawCombinedQueryDefinition(queryHandle);
        DocumentPage documents = documentManager.search(queryDef, 1);

        while (documents.hasNext())
        {
            DocumentRecord document = documents.next();
            StringHandle resultHandle = document.getContent(new StringHandle());
            String result = resultHandle.get();
            System.out.println(result);
        }
    }
}

System.out.println()结果

{"state":"OH", "city":"Dayton", "notes":"not Cincinnati"} 
{"state":"OH", "city":"Cincinnati", "notes":"real city"}

为什么Java客户端返回city = Dayton的第一个结果?

提前致谢!

解决方法:

REST API以及Java API默认执行未经过滤的搜索(意味着匹配完全基于索引).相比之下,cts:search()在默认情况下执行过滤的搜索(意味着,检查结果文档以排除误报).

如果将“ unfiltered”选项添加到cts:search(),它也会返回两个文档.

快速解决方案是在Java API搜索中添加“过滤”选项,而更好的大规模性能解决方案是优化索引以支持所需通配符查询的精确匹配.

元素根据位置与通配符相关.

因此,对于此查询,我相信您需要打开元素单词位置和三个字符单词位置的索引配置.

希望能有所帮助,

标签:marklogic,java,marklogic-9
来源: https://codeday.me/bug/20191025/1928824.html