首页 > 代码库 > elasticsearch的javaAPI之index

elasticsearch的javaAPI之index

Index API

原文:http://www.elasticsearch.org/guide/en/elasticsearch/client/java-api/current/index_.html

index API允许你将JSON document转换为一个特定的index,使它便于搜索操作。

生成JSON文档:

有几种不同的方法生成一个JSON document:

  • 手动使用 byte[] String
  • 使用一个map来等效转换为JSON
  • 使用第三方库来将beans装换(如Jackson)
  • 使用内置的XContentFactory.jsonBuilder()

在内部,每一个类型转换为 byte[] (所以String转换到byte[])。 因此,如果对象是已经在这个形式, 就直接使用它。jsonBuilder 是高度优化的JSON生成机制,用来直接构造为byte[]

动手试一试:

这里没有特别困难的,但请注意,您将必须根据DateFormate来格式化日期。

String json = "{" +
        "\"user\":\"kimchy\"," +
        "\"postDate\":\"2013-01-30\"," +
        "\"message\":\"trying out Elasticsearch\"" +
    "}";

使用map

map是一个关键:值对集合。 它较好的表示JSON 结构:

Map<String, Object> json = new HashMap<String, Object>();
json.put("user","kimchy");
json.put("postDate",new Date());
json.put("message","trying out Elasticsearch");

序列化beans

Elasticsearch已经使用jackson,在org.elasticsearch.common.jackson 包中。 所以,你可以添加自己Jackson版本到pom.xml 文件或在你的classpath中。

例如:

<dependency>
    <groupId>com.fasterxml.jackson.core</groupId>
    <artifactId>jackson-databind</artifactId>
    <version>2.1.3</version>
</dependency>

然后,您可以开始序列化JSON bean:

import com.fasterxml.jackson.databind.*;

// instance a json mapper
ObjectMapper mapper = new ObjectMapper(); // create once, reuse

// generate json
String json = mapper.writeValueAsString(yourbeaninstance);

使用Elasticsearch helpers

Elasticsearch提供了内置的帮手来生成JSON内容

import static org.elasticsearch.common.xcontent.XContentFactory.*;

XContentBuilder builder = jsonBuilder()
    .startObject()
        .field("user", "kimchy")
        .field("postDate", new Date())
        .field("message", "trying out Elasticsearch")
    .endObject()

注意,您还可以添加数组 startArray(String)endArray() 方法。 顺便说一下,field方法 接受很多对象类型。 你可以直接使用数字、日期,甚至其他XContentBuilder对象。

如果你需要看生成的JSON内容,您可以使用string()方法。

String json = builder.string();

Indexdocument:

下面的示例索引将JSON document转换为一个索引 (twitter),type为tweet,id为1:

import static org.elasticsearch.common.xcontent.XContentFactory.*;

IndexResponse response = client.prepareIndex("twitter", "tweet", "1")
        .setSource(jsonBuilder()
                    .startObject()
                        .field("user", "kimchy")
                        .field("postDate", new Date())
                        .field("message", "trying out Elasticsearch")
                    .endObject()
                  )
        .execute()
        .actionGet();

请注意,您也可以index document作为JSON Strings,你不用给一个ID:

String json = "{" +
        "\"user\":\"kimchy\"," +
        "\"postDate\":\"2013-01-30\"," +
        "\"message\":\"trying out Elasticsearch\"" +
    "}";

IndexResponse response = client.prepareIndex("twitter", "tweet")
        .setSource(json)
        .execute()
        .actionGet();

IndexResponse 对象将给你一个report:

// Index name
String _index = response.getIndex();
// Type name
String _type = response.getType();
// Document ID (generated or not)
String _id = response.getId();
// Version (if it‘s the first time you index this document, you will get: 1)
long _version = response.getVersion();

如果你使用percolation构造索引, IndexResponse对象会给相应的过滤器:

IndexResponse response = client.prepareIndex("twitter", "tweet", "1")
        .setSource(json)
        .execute()
        .actionGet();

List<String> matches = response.matches();

Operation threading:

Index API允许你设置线程来执行操作,实际执行API上执行的是相同的节点(API上执行一个分配在同一服务器的shard上)。

不同的线程上执行操作,或调用线程执行(注意,API仍然是异步)。默认情况下, operationThreaded 被设置为true,这意味着操作是由不同的线程上执行。 


原文:http://www.elasticsearch.org/guide/en/elasticsearch/client/java-api/current/index_.html

翻译欠佳,希望不会对大家造成误导

elasticsearch的javaAPI之index