Pertanyaan Baca / ubah InputStream ke String


Jika Anda punya java.io.InputStream objek, bagaimana seharusnya Anda memproses objek itu dan menghasilkan String?


Misalkan saya punya InputStream yang berisi data teks, dan saya ingin mengonversinya menjadi a String, jadi misalnya saya bisa menulis itu ke file log.

Apa cara termudah untuk mengambil InputStream dan mengubahnya menjadi a String?

public String convertStreamToString(InputStream is) { 
    // ???
}

3263
2017-11-21 16:47


asal


Jawaban:


Cara yang bagus untuk melakukan ini adalah menggunakan Apache commons  IOUtils untuk menyalin InputStream menjadi StringWriter... sesuatu seperti

StringWriter writer = new StringWriter();
IOUtils.copy(inputStream, writer, encoding);
String theString = writer.toString();

atau bahkan

// NB: does not close inputStream, you'll have to use try-with-resources for that
String theString = IOUtils.toString(inputStream, encoding); 

Atau, Anda bisa menggunakan ByteArrayOutputStream jika Anda tidak ingin mencampur Streaming dan Penulis Anda


2044
2017-11-21 16:54



Berikut ini cara menggunakan hanya pustaka Java standar (perhatikan bahwa aliran tidak tertutup, YMMV).

static String convertStreamToString(java.io.InputStream is) {
    java.util.Scanner s = new java.util.Scanner(is).useDelimiter("\\A");
    return s.hasNext() ? s.next() : "";
}

Saya belajar trik ini dari "Trik Scanner Bodoh" artikel. Alasan kerjanya adalah karena Scanner mengulang-ulang token di aliran, dan dalam hal ini kita memisahkan token menggunakan "permulaan batas input" (\ A) sehingga memberi kita hanya satu token untuk seluruh konten aliran.

Perhatikan, jika Anda harus spesifik tentang pengodean aliran masukan, Anda dapat memberikan argumen kedua untuk Scanner konstruktor yang menunjukkan charset apa yang digunakan (mis. "UTF-8").

Hat tip juga berlaku untuk Jacob, yang pernah menunjuk saya ke artikel itu.

DIEDIT: Terima kasih atas saran dari Patrick, membuat fungsi lebih kuat saat menangani aliran input kosong. Satu suntingan lagi: nixed try / catch, cara Patrick lebih singkat.


2092
2018-03-26 20:40



Ringkaslah jawaban lain saya menemukan 11 cara utama untuk melakukan ini (lihat di bawah). Dan saya menulis beberapa tes kinerja (lihat hasil di bawah):

Cara mengonversi InputStream ke String:

  1. Menggunakan IOUtils.toString (Apache Utils)

    String result = IOUtils.toString(inputStream, StandardCharsets.UTF_8);
    
  2. Menggunakan CharStreams (Jambu biji)

    String result = CharStreams.toString(new InputStreamReader(
          inputStream, Charsets.UTF_8));
    
  3. Menggunakan Scanner (JDK)

    Scanner s = new Scanner(inputStream).useDelimiter("\\A");
    String result = s.hasNext() ? s.next() : "";
    
  4. Menggunakan Streaming API (Java 8). PERINGATAN: Solusi ini mengubah jeda baris yang berbeda (seperti \r\n) ke \n.

    String result = new BufferedReader(new InputStreamReader(inputStream))
      .lines().collect(Collectors.joining("\n"));
    
  5. Menggunakan API Aliran paralel (Java 8). PERINGATAN: Solusi ini mengubah jeda baris yang berbeda (seperti \r\n) ke \n.

    String result = new BufferedReader(new InputStreamReader(inputStream)).lines()
       .parallel().collect(Collectors.joining("\n"));
    
  6. Menggunakan InputStreamReader dan StringBuilder (JDK)

    final int bufferSize = 1024;
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    Reader in = new InputStreamReader(inputStream, "UTF-8");
    for (; ; ) {
        int rsz = in.read(buffer, 0, buffer.length);
        if (rsz < 0)
            break;
        out.append(buffer, 0, rsz);
    }
    return out.toString();
    
  7. Menggunakan StringWriter dan IOUtils.copy (Apache Commons)

    StringWriter writer = new StringWriter();
    IOUtils.copy(inputStream, writer, "UTF-8");
    return writer.toString();
    
  8. Menggunakan ByteArrayOutputStream dan inputStream.read (JDK)

    ByteArrayOutputStream result = new ByteArrayOutputStream();
    byte[] buffer = new byte[1024];
    int length;
    while ((length = inputStream.read(buffer)) != -1) {
        result.write(buffer, 0, length);
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return result.toString("UTF-8");
    
  9. Menggunakan BufferedReader (JDK). PERINGATAN: Solusi ini mengubah jeda baris yang berbeda (seperti \n\r) ke line.separator properti sistem (misalnya, di Windows ke "\ r \ n").

    String newLine = System.getProperty("line.separator");
    BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
    StringBuilder result = new StringBuilder();
    String line; boolean flag = false;
    while ((line = reader.readLine()) != null) {
        result.append(flag? newLine: "").append(line);
        flag = true;
    }
    return result.toString();
    
  10. Menggunakan BufferedInputStream dan ByteArrayOutputStream (JDK)

    BufferedInputStream bis = new BufferedInputStream(inputStream);
    ByteArrayOutputStream buf = new ByteArrayOutputStream();
    int result = bis.read();
    while(result != -1) {
        buf.write((byte) result);
        result = bis.read();
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return buf.toString("UTF-8");
    
  11. Menggunakan inputStream.read() dan StringBuilder (JDK). PERINGATAN: Solusi ini bermasalah dengan Unicode, misalnya dengan teks Rusia (berfungsi dengan benar hanya dengan teks non-Unicode)

    int ch;
    StringBuilder sb = new StringBuilder();
    while((ch = inputStream.read()) != -1)
        sb.append((char)ch);
    reset();
    return sb.toString();
    

PERINGATAN:

  1. Solusi 4, 5 dan 9 mengubah jeda baris yang berbeda menjadi satu.

  2. Solusi 11 tidak dapat berfungsi dengan benar dengan teks Unicode

Tes kinerja

Tes kinerja untuk kecil String (panjang = 175), url masuk github (mode = Waktu Rata-rata, sistem = Linux, skor 1,343 adalah yang terbaik):

              Benchmark                         Mode  Cnt   Score   Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   1,343 ± 0,028  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   6,980 ± 0,404  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   7,437 ± 0,735  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10   8,977 ± 0,328  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10  10,613 ± 0,599  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10  10,605 ± 0,527  us/op
 3. Scanner (JDK)                               avgt   10  12,083 ± 0,293  us/op
 2. CharStreams (guava)                         avgt   10  12,999 ± 0,514  us/op
 4. Stream Api (Java 8)                         avgt   10  15,811 ± 0,605  us/op
 9. BufferedReader (JDK)                        avgt   10  16,038 ± 0,711  us/op
 5. parallel Stream Api (Java 8)                avgt   10  21,544 ± 0,583  us/op

Tes kinerja untuk besar String (panjang = 50100), url masuk github (mode = Waktu Rata-rata, sistem = Linux, skor 200,715 adalah yang terbaik):

               Benchmark                        Mode  Cnt   Score        Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   200,715 ±   18,103  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10   300,019 ±    8,751  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   347,616 ±  130,348  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10   352,791 ±  105,337  us/op
 2. CharStreams (guava)                         avgt   10   420,137 ±   59,877  us/op
 9. BufferedReader (JDK)                        avgt   10   632,028 ±   17,002  us/op
 5. parallel Stream Api (Java 8)                avgt   10   662,999 ±   46,199  us/op
 4. Stream Api (Java 8)                         avgt   10   701,269 ±   82,296  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   740,837 ±    5,613  us/op
 3. Scanner (JDK)                               avgt   10   751,417 ±   62,026  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10  2919,350 ± 1101,942  us/op

Grafik (tes kinerja tergantung pada panjang Input Streaming dalam sistem Windows 7)
enter image description here

Tes kinerja (Waktu Rata-Rata) tergantung pada panjang Masukan Streaming dalam sistem Windows 7:

 length  182    546     1092    3276    9828    29484   58968

 test8  0.38    0.938   1.868   4.448   13.412  36.459  72.708
 test4  2.362   3.609   5.573   12.769  40.74   81.415  159.864
 test5  3.881   5.075   6.904   14.123  50.258  129.937 166.162
 test9  2.237   3.493   5.422   11.977  45.98   89.336  177.39
 test6  1.261   2.12    4.38    10.698  31.821  86.106  186.636
 test7  1.601   2.391   3.646   8.367   38.196  110.221 211.016
 test1  1.529   2.381   3.527   8.411   40.551  105.16  212.573
 test3  3.035   3.934   8.606   20.858  61.571  118.744 235.428
 test2  3.136   6.238   10.508  33.48   43.532  118.044 239.481
 test10 1.593   4.736   7.527   20.557  59.856  162.907 323.147
 test11 3.913   11.506  23.26   68.644  207.591 600.444 1211.545

1649
2018-02-17 00:58



Apache Commons memungkinkan:

String myString = IOUtils.toString(myInputStream, "UTF-8");

Tentu saja, Anda bisa memilih pengkodean karakter lain selain UTF-8.

Juga lihat: (Dokumen)


794
2017-12-08 20:13



Mempertimbangkan file yang pertama harus mendapatkan java.io.Reader contoh. Ini kemudian dapat dibaca dan ditambahkan ke a StringBuilder (kita tidak perlu StringBuffer jika kita tidak mengaksesnya dalam beberapa utas, dan StringBuilder lebih cepat). Triknya di sini adalah bahwa kita bekerja dalam blok, dan dengan demikian tidak perlu aliran buffering lainnya. Ukuran blok adalah parameter untuk pengoptimalan kinerja run-time.

public static String slurp(final InputStream is, final int bufferSize) {
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    try (Reader in = new InputStreamReader(is, "UTF-8")) {
        for (;;) {
            int rsz = in.read(buffer, 0, buffer.length);
            if (rsz < 0)
                break;
            out.append(buffer, 0, rsz);
        }
    }
    catch (UnsupportedEncodingException ex) {
        /* ... */
    }
    catch (IOException ex) {
        /* ... */
    }
    return out.toString();
}

263
2017-08-04 08:29



Bagaimana dengan ini?

InputStream in = / * InputStream * Anda * /;
StringBuilder sb=new StringBuilder();
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String read;

while((read=br.readLine()) != null) {
    //System.out.println(read);
    sb.append(read);   
}

br.close();
return sb.toString();

226
2017-07-13 15:56



Jika Anda menggunakan Google-Collections / Guava, Anda dapat melakukan hal-hal berikut:

InputStream stream = ...
String content = CharStreams.toString(new InputStreamReader(stream, Charsets.UTF_8));
Closeables.closeQuietly(stream);

Perhatikan bahwa parameter kedua (mis. Charsets.UTF_8) untuk InputStreamReader tidak diperlukan, tetapi biasanya merupakan ide yang baik untuk menentukan pengkodean jika Anda mengetahuinya (yang Anda harus lakukan!)


153
2018-05-08 20:24



Ini adalah solusi Java & Android murni saya, berfungsi dengan baik ...

public String readFullyAsString(InputStream inputStream, String encoding)
        throws IOException {
    return readFully(inputStream).toString(encoding);
}    

public byte[] readFullyAsBytes(InputStream inputStream)
        throws IOException {
    return readFully(inputStream).toByteArray();
}    

private ByteArrayOutputStream readFully(InputStream inputStream)
        throws IOException {
    ByteArrayOutputStream baos = new ByteArrayOutputStream();
    byte[] buffer = new byte[1024];
    int length = 0;
    while ((length = inputStream.read(buffer)) != -1) {
        baos.write(buffer, 0, length);
    }
    return baos;
}

107
2018-06-10 21:07



Bagaimana tentang:

import java.io.BufferedInputStream;
import java.io.ByteArrayOutputStream;
import java.io.InputStream;
import java.io.IOException;    

public static String readInputStreamAsString(InputStream in) 
    throws IOException {

    BufferedInputStream bis = new BufferedInputStream(in);
    ByteArrayOutputStream buf = new ByteArrayOutputStream();
    int result = bis.read();
    while(result != -1) {
      byte b = (byte)result;
      buf.write(b);
      result = bis.read();
    }        
    return buf.toString();
}

56
2018-01-01 03:43



Inilah solusi Java-murni (tanpa perpustakaan) yang paling elegan yang saya temukan setelah beberapa percobaan:

public static String fromStream(InputStream in) throws IOException
{
    BufferedReader reader = new BufferedReader(new InputStreamReader(in));
    StringBuilder out = new StringBuilder();
    String newLine = System.getProperty("line.separator");
    String line;
    while ((line = reader.readLine()) != null) {
        out.append(line);
        out.append(newLine);
    }
    return out.toString();
}

55
2017-09-02 11:50