2015-01-07 3 views
0

Я разбор файлов в формате JSON, где я доступ черезGson JSON синтаксический анализа не работает

http://api.crossref.org/works?rows=1000&offset=6000000

Есть около 71 миллионов различных записей публикаций и связи я дал это только представляет 1000. В моем Java-код gson анализатор в основном работает хорошо, но иногда он дает ошибку следующим образом:

com.google.gson.JsonSyntaxException: com.google.gson.stream.MalformedJsonException: Unterminated string at line 2 column 1 
     at com.google.gson.internal.Streams.parse(Streams.java:56) 
     at com.google.gson.JsonParser.parse(JsonParser.java:84) 
     at com.google.gson.JsonParser.parse(JsonParser.java:59) 
     at com.google.gson.JsonParser.parse(JsonParser.java:45) 
     at connectingurl.CrossRefFullTextToTable.<init>(CrossRefFullTextToTable.java:84) 
     at connectingurl.CrossRefFullTextToTable.main(CrossRefFullTextToTable.java:181) 
    Caused by: com.google.gson.stream.MalformedJsonException: Unterminated string at line 2 column 1 
     at com.google.gson.stream.JsonReader.syntaxError(JsonReader.java:1310) 
     at com.google.gson.stream.JsonReader.nextString(JsonReader.java:1046) 
     at com.google.gson.stream.JsonReader.nextValue(JsonReader.java:784) 
     at com.google.gson.stream.JsonReader.objectValue(JsonReader.java:766) 
     at com.google.gson.stream.JsonReader.peek(JsonReader.java:380) 
     at com.google.gson.internal.bind.TypeAdapters$25.read(TypeAdapters.java:635) 
     at com.google.gson.internal.bind.TypeAdapters$25.read(TypeAdapters.java:658) 
     at com.google.gson.internal.bind.TypeAdapters$25.read(TypeAdapters.java:650) 
     at com.google.gson.internal.bind.TypeAdapters$25.read(TypeAdapters.java:658) 
     at com.google.gson.internal.bind.TypeAdapters$25.read(TypeAdapters.java:658) 
     at com.google.gson.internal.bind.TypeAdapters$25.read(TypeAdapters.java:633) 
     at com.google.gson.internal.Streams.parse(Streams.java:44) 

Как я искал это, скорее всего, может возникнуть проблема памяти.

Вот часть моего кода Java:

if(code == 200){ 

    String full_text_link = ""; 
    String license = ""; 

    BufferedReader in = new BufferedReader(new InputStreamReader(yc.getInputStream(), "UTF-8")); 
    StringBuilder sb = new StringBuilder(); 

    String inputLine; 
    while ((inputLine = in.readLine()) != null) { 
     sb.append(inputLine + System.getProperty("line.separator")); 
    } 
    in.close(); 
    String jsonLine = sb.toString(); 


    JsonElement jelement = new JsonParser().parse(jsonLine);  
    JsonObject jobject = jelement.getAsJsonObject(); 
    jobject = jobject.getAsJsonObject("message"); 
    JsonArray jarray_items = jobject.getAsJsonArray("items"); 

    ... 
} 

ошибка исходит от линии:

JsonElement jelement = new JsonParser().parse(jsonLine); 

кажется gson могут иметь такие проблемы. есть ли какое-либо другое предложение использовать другой парсер или есть что-то, что я должен добавить в свой код?

Заранее спасибо ...

+0

вы могли бы использовать процессор FasterXML JSON в качестве альтернативы (работает очень хорошо), но можно с уверенностью предположить, что ошибка не входит в GSON - ваш JSON неверен или ваш собственный код имеет ошибки. – specializt

ответ

1
while ((inputLine = in.readLine()) != null) { 
    sb.append(inputLine + System.getProperty("line.separator")); 
} 

Вы в основном модифицируя ввод без причины, вы не можете просто предварительно обработать ваш JSON, не зная точного синтаксиса, чтобы решить проблему, которую вы можете позволить GSON читать сам файл, например:

http://www.java2blog.com/2013/11/gson-example-read-and-write-json.html

package org.arpit.java2blog; 

import java.io.BufferedReader; 
import java.io.FileReader; 
import java.io.IOException; 
import java.util.List; 
import org.arpit.java2blog.pojo.Country; 
import com.google.gson.Gson; 

/* 
* @Author : Arpit Mandliya 
*/ 
public class GSONReadingFromFileExample { 

public static void main(String[] args) { 

    Gson gson = new Gson(); 

    try { 

    System.out.println("Reading JSON from a file"); 
    System.out.println("----------------------------"); 

    BufferedReader br = new BufferedReader(
    new FileReader("E:\\file.json")); 

    //convert the json string back to object 
    Country countryObj = gson.fromJson(br, Country.class); 

    System.out.println("Name Of Country: "+countryObj.getName()); 


    System.out.println("Population: "+countryObj.getPopulation()); 

    System.out.println("States are :"); 

    List<String> listOfStates = countryObj.getListOfStates(); 
    for (int i = 0; i < listOfStates.size(); i++) { 
    System.out.println(listOfStates.get(i)); 
    } 

    } catch (IOException e) { 
    e.printStackTrace(); 
    } 
} 
} 
+0

Спасибо @specializt. Но я немного смущен. Чтобы получить данные из URL-адреса, не нужно ли его преобразовывать в текст? напр. http://stackoverflow.com/questions/7467568/parsing-json-from-url –

+0

Нет. Это уже текст. – specializt

Смежные вопросы