1.进入百度云控制台,找到文字识别服务,创建一个应用
2.引入ocr需要的maven依赖包
<dependency><groupId>com.baidu.aip</groupId><artifactId>java-sdk</artifactId><version>4.16.11</version>
</dependency>
3.直接上代码编写一个简单的测试方法
import java.util.*;
import org.json.JSONException;
import org.json.JSONObject;
import com.baidu.aip.ocr.AipOcr;
/*** 图片文字提取*/
public class TextExtraction {//设置APPID/AK/SKpublic static final String APP_ID = "xxx";public static final String API_KEY = "xxxxxx";public static final String SECRET_KEY = "xxxxx";public static void main(String[] args) throws JSONException {// 初始化一个AipOcrAipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);// 可选:设置网络连接参数client.setConnectionTimeoutInMillis(2000);client.setSocketTimeoutInMillis(60000);// 调用接口String path = "D:/test/test.jpg";JSONObject res = client.basicGeneral(path, new HashMap<String, String>());System.out.println(res.toString(2));}}
注:APP_ID,API_KEY,SECRET_KEY换成自己的。
4.运行测试方法,我测试的图片如下:
5.运行结果如下
图片的每一行字放在一个对象里面