docs/api_reference/cv.md
请把编译脚本 Paddle-Lite/lite/tool/build_linux.sh 中 BUILD_CV 变量设置为 ON, 其他编译参数设置请参考 源码编译, 以确保 Paddle Lite 可以正确编译。这样CV 图像的加速库就会编译进去,且会生成 paddle_image_preprocess.h 的API文件
ARMMAC 和 LINUX#include <paddle_image_preprocess.h>
Paddle Lite 支持不同颜色空间的图像相互转换 Convert 、缩放 Resize 、翻转 Flip、旋转 Rotate 和图像数据转换为 Tensor 存储 ImageToTensor 功能,下文将详细介绍每个功能的 API 接口。
enum ImageFormat {
RGBA = 0,
BGRA,
RGB,
BGR,
GRAY,
NV21 = 11,
NV12
};
enum FlipParam {
X = 0, // flip along the X axis
Y, // flip along the Y axis
XY // flip along the XY axis
};
typedef struct {
int ih; // input height
int iw; // input width
int oh; // outpu theight
int ow; // output width
FlipParam flip_param; // flip, support x, y, xy
float rotate_param; // rotate, support 90, 180, 270
} TransParam;
ImagePreprocess 类含有以下三个私有成员变量,通过构造函数进行初始化。
private:
ImageFormat srcFormat_; // input image color format
ImageFormat dstFormat_; // output image color format
TransParam transParam_; // image transform parameter
// init
ImagePreprocess::ImagePreprocess(ImageFormat srcFormat, ImageFormat dstFormat, TransParam param) {
this->srcFormat_ = srcFormat;
this->dstFormat_ = dstFormat;
this->transParam_ = param;
}
Convert 函数支持颜色空间:GRAY、NV12(NV21)、RGB(BGR) 和 RGBA(BGRA)
目前支持以下颜色空间的相互转换:
目前支持以下颜色空间的单向转换:
Convert 功能的 API 接口
// 方法一
void ImagePreprocess::image_convert(const uint8_t* src, uint8_t* dst);
// 方法二
void ImagePreprocess::image_convert(const uint8_t* src,
uint8_t* dst, ImageFormat srcFormat, ImageFormat dstFormat);
// 方法三
void ImagePreprocess::image_convert(const uint8_t* src,
uint8_t* dst, ImageFormat srcFormat, ImageFormat dstFormat,
int srcw, int srch);
image_convert 接口,缺省参数来源于 ImagePreprocess 类的成员变量。故在初始化 ImagePreprocess 类的对象时,必须要给以下成员变量赋值:
ImagePreprocess 类的成员变量srcFormat_ImagePreprocess 类的成员变量dstFormat_ImagePreprocess 类的成员变量transParam_结构体中的iw变量ImagePreprocess 类的成员变量transParam_结构体中的ih变量第二个image_convert 接口,缺省参数来源于 ImagePreprocess 类的成员变量。故在初始化 ImagePreprocess 类的对象时,必须要给以下成员变量赋值:
ImagePreprocess 类的成员变量 transParam_ 结构体中的 iw 变量ImagePreprocess 类的成员变量 transParam_ 结构体中的 ih 变量第三个image_convert 接口, 可以直接使用
Resize 功能支持颜色空间:GRAY、NV12(NV21)、RGB(BGR) 和 RGBA(BGRA)
Resize 功能目前支持的方法:bilinear
Resize 功能的 API 接口
// 方法一
void ImagePreprocess::image_resize(const uint8_t* src, uint8_t* dst);
// 方法二
void ImagePreprocess::image_resize(const uint8_t* src, uint8_t* dst, ImageFormat srcFormat, ImageFormat srcFormat, int srcw, int srch, int dstw, int dsth);
image_resize 接口,缺省参数来源于 ImagePreprocess 类的成员变量。故在初始化ImagePreprocess 类的对象时,必须要给以下成员变量赋值:
ImagePreprocess 类的成员变量 dstFormat_ImagePreprocess 类的成员变量 transParam_.iwImagePreprocess 类的成员变量 transParam_.ihImagePreprocess 类的成员变量 transParam_.owImagePreprocess 类的成员变量 transParam_.owimage_resize 接口,可以直接使用Rotate 功能支持颜色空间:GRAY、RGB(BGR) 和 RGBA(BGRA)
Rotate 功能目前支持的角度:90、180 和 270
Rotate 功能的 API 接口
// 方法一
void ImagePreprocess::image_rotate(const uint8_t* src, uint8_t* dst);
// 方法二
void ImagePreprocess::image_rotate(const uint8_t* src, uint8_t* dst, ImageFormat srcFormat, ImageFormat srcFormat, int srcw, int srch, float degree);
image_rotate 接口,缺省参数来源于 ImagePreprocess 类的成员变量。故在初始化ImagePreprocess 类的对象时,必须要给以下成员变量赋值:
ImagePreprocess 类的成员变量 dstFormat_ImagePreprocess 类的成员变量 transParam_.owImagePreprocess 类的成员变量 transParam_.ohImagePreprocess 类的成员变量 transParam_.rotate_paramimage_rotate 接口,可以直接使用Flip 功能支持颜色空间:GRAY、RGB(BGR) 和 RGBA(BGRA)
Flip 功能目前支持的功能:沿 X 轴翻转、沿 Y 轴翻转和沿 XY 轴翻转
Flip 功能的 API 接口
// 方法一
void ImagePreprocess::image_flip(const uint8_t* src, uint8_t* dst);
// 方法二
void ImagePreprocess::image_flip(const uint8_t* src, uint8_t* dst, ImageFormat srcFormat, ImageFormat srcFormat, int srcw, int srch, FlipParam flip_param);
image_flip 接口,缺省参数来源于 ImagePreprocess 类的成员变量。故在初始化ImagePreprocess 类的对象时,必须要给以下成员变量赋值:
ImagePreprocess 类的成员变量 dstFormat_ImagePreprocess 类的成员变量 transParam_.owImagePreprocess 类的成员变量 transParam_.ohImagePreprocess 类的成员变量 transParam_.flip_paramimage_flip 接口,可以直接使用Crop 功能支持颜色空间:GRAY、RGB(BGR) 和 RGBA(BGRA)
Crop 功能的 API 接口
// 方法一
void ImagePreprocess::image_crop(const uint8_t* src, uint8_t* dst, ImageFormat srcFormat, ImageFormat srcFormat, int srcw, int srch, FlipParam flip_param);
image_crop 接口可以直接使用, 各参数含义如下:
Image2Tensor 功能支持颜色空间:RGB(BGR) 和 RGBA(BGRA)Image2Tensor 功能目前支持的 Layout:NCHW 和 NHWCImage2Tensor 不仅完成图像转换为 Tensor 数据处理,而且还完成了图像数据的归一化处理Image2Tensor 功能的 API 接口
// 方法一
void ImagePreprocess::image_to_tensor(const uint8_t* src, Tensor* dstTensor, LayoutType layout, float* means, float* scales);
// 方法二
void ImagePreprocess::image_to_tensor(const uint8_t* src, Tensor* dstTensor, ImageFormat srcFormat, srcw, int srch, LayoutType layout, float* means, float* scales;
image_to_tensor 接口,缺省参数来源于 ImagePreprocess 类的成员变量。故在初始化 ImagePreprocess 类的对象时,必须要给以下成员变量赋值:
ImagePreprocess 类的成员变量 dstFormat_ImagePreprocess 类的成员变量 transParam_.owImagePreprocess 类的成员变量 transParam_.ohimage_to_tensor 接口,可以直接使用例子:
输入 1920x1080 大小的 NV12 图像 src,输出 960x540 大小 RGB 格式的图像 dst;
然后,完成 90 度旋转和沿 X 轴翻转功能;
最后,用 NHWC 格式存储在 Tensor 里。
定义 ImagePreprocess 类的对象,初始化成员变量
// init
srcFormat = ImageFormat::NV12;
dstFormat = ImageFormat::RGB;
srch = 1920;
srcw = 1080;
dsth = 960;
dstw = 540;
flip_param = FlipParam::X;
degree = 90;
layout = LayoutType::NHWC;
left_x = 1;
left_y = 1;
// 方法一:
TransParam tparam;
tparam.ih = srch;
tparam.iw = srcw;
tparam.oh = dsth;
tparam.ow = dstw;
tparam.flip_param = flip_param;
tparam.rotate_param = degree;
ImagePreprocess image_preprocess(srcFormat, dstFormat, tparam);
// 方法二:
ImagePreprocess image_preprocess();
// 方法一:
image_preprocess.image_convert(src, lite_dst);
// 方法二:
image_preprocess.image_convert(src, lite_dst, (ImageFormat)srcFormat, (ImageFormat)dstFormat);
// 方法一:
image_preprocess.image_resize(lite_dst, resize_tmp);
// 方法二:
image_preprocess.image_resize(lite_dst,resize_tmp, (ImageFormat)dstFormat, srcw,
srch, dstw, dsth);
// 方法一:
image_preprocess.image_rotate(resize_tmp, tv_out_ratote);
// 方法二:
image_preprocess.image_rotate(resize_tmp,tv_out_ratote, (ImageFormat)dstFormat, dstw, dsth, degree);
// 方法一:
image_preprocess.image_flip(tv_out_ratote, tv_out_flip);
// 方法二:
image_preprocess.image_flip(tv_out_ratote, tv_out_flip, (ImageFormat)dstFormat, dstw, dsth, flip_param);
// 方法一:
image_preprocess.image_crop(src, dst, (ImageFormat)srcFormat, srcw, srch, left_x, left_y, dstw, dsth);
// 方法一:
image_preprocess.image_to_tensor(tv_out_flip, &dst_tensor, layout, means, scales);
// 方法二:
image_preprocess.image_to_tensor(tv_out_flip, &dst_tensor,(ImageFormat)dstFormat, dstw, dsth, layout, means, scales);