`image` — 机器视觉¶

image 模块用于机器视觉。

函数¶

image.binary_to_grayscale(binary_image_value)¶: 返回二进制值(0-1)对应的灰度值(0-255)。

image.binary_to_rgb(binary_image_value)¶: 返回二进制值(0-1)对应的RGB888格式的元组(r, g, b)。

image.binary_to_lab(binary_image_value)¶

返回二进制值(0-1)对应的LAB格式的元组(l, a, b)。

L的范围为0到100, A和B的范围为-128到128。

image.binary_to_yuv(binary_image_value)¶

返回二进制值(0-1)对应的YUV格式的元组(y, u, v)。

Y的范围为0到255, U和V范围为-128到128。

image.grayscale_to_binary(grayscale_value)¶: 返回灰度值(0-255)对应的二进制值(0-1)。

image.grayscale_to_rgb(grayscale_value)¶: 返回灰度值(0-255)对应的RGB888格式的元组(r, g, b)。

备注

使用RGB565->RGB888进程进行转换，因此此方法不会像纯RGB888系统那样返回准确的值。但是，图像库在内部这样工作是正确的。

image.grayscale_to_lab(grayscale_value)¶

返回灰度值(0-255)对应的LAB格式的元组(l, a, b)。

L的范围为0到100, A和B的范围为-128到128。

备注

使用RGB565->LAB进程进行转换，因此此方法不会像纯LAB系统那样返回确切的值。但是，图像库在内部这样工作是正确的。

image.grayscale_to_yuv(grayscale_value)¶

返回灰度值(0-255)对应的YUV格式的元组(y, u, v)。

Y的范围为0到255, U和V范围为-128到128。

备注

使用RGB888->RGB565进程进行转换，因此此方法不会像纯RGB888系统那样返回准确的值。但是，图像库在内部这样工作是正确的。

image.rgb_to_binary(rgb_tuple)¶: 返回RGB888格式的元组(r, g, b)对应的中心范围阈值二进制值(0-1)。

备注

用RGB888->RGB565进程进行转换，因此此方法不会像纯RGB888系统那样返回准确的值。但是，图像库在内部这样工作是正确的。

image.rgb_to_grayscale(rgb_tuple)¶: 返回RGB888格式的元组(r, g, b)对应的灰度值(0-255)。

备注

用RGB888->RGB565进程进行转换，因此此方法不会像纯RGB888系统那样返回准确的值。但是，图像库在内部这样工作是正确的。

image.rgb_to_lab(rgb_tuple)¶

返回RGB888格式的元组(r, g, b)对应的LAB格式的元组(l, a, b)。

L的范围为0到100, A和B的范围为-128到128。

备注

用RGB888->RGB565进程进行转换，因此此方法不会像纯RGB888系统那样返回准确的值。但是，图像库在内部这样工作是正确的。

image.rgb_to_yuv(rgb_tuple)¶

返回RGB888格式的元组(r, g, b)对应的YUV格式的元组(y, u, v)。

Y的范围为0到255, U和V范围为-128到128。

备注

用RGB888->RGB565进程进行转换，因此此方法不会像纯RGB888系统那样返回准确的值。但是，图像库在内部这样工作是正确的。

image.lab_to_binary(lab_tuple)¶: 返回LAB格式的元组(l, a, b)对应的中心范围阈值二进制值(0-1)。

备注

固件使用LAB->RGB565进程进行转换，因此此方法不会像纯LAB系统那样返回确切的值。但是，图像库在内部这样工作是正确的。

image.lab_to_grayscale(lab_tuple)¶: 返回LAB格式的元组(l, a, b)对应的灰度值(0-255)。

备注

固件使用LAB->RGB565进程进行转换，因此此方法不会像纯LAB系统那样返回确切的值。但是，图像库在内部这样工作是正确的。

image.lab_to_rgb(lab_tuple)¶: 返回LAB格式的元组 lab_tuple (l, a, b)对应的RGB888格式的元组(r, g, b)。

备注

固件使用LAB->RGB565进程进行转换，因此此方法不会像纯LAB系统那样返回确切的值。但是，图像库在内部这样工作是正确的。

image.lab_to_yuv(lab_tuple)¶

返回LAB格式的元组(l, a, b)对应的YUV格式的元组(y, u, v)。

Y的范围为0到255, U和V范围为-128到128。

备注

固件使用LAB->RGB565进程进行转换，因此此方法不会像纯LAB系统那样返回确切的值。但是，图像库在内部这样工作是正确的。

image.yuv_to_binary(yuv_tuple)¶: 返回YUV格式的元组(y, u, v)对应的中心范围阈值二进制值(0-1)。

备注

固件使用YUV->RGB565进程进行转换，因此此方法不会像纯YUV系统那样返回确切的值。但是，图像库在内部这样工作是正确的。

image.yuv_to_grayscale(yuv_tuple)¶: 返回YUV格式的元组(y, u, v)对应的灰度值(0-255)。

备注

固件使用YUV->RGB565进程进行转换，因此此方法不会像纯YUV系统那样返回确切的值。但是，图像库在内部这样工作是正确的。

image.yuv_to_rgb(lab_tuple)¶: 返回YUV格式的元组(y, u, v)对应的RGB888格式的元组(r, g, b)。

备注

固件使用YUV->RGB565进程进行转换，因此此方法不会像纯YUV系统那样返回确切的值。但是，图像库在内部这样工作是正确的。

image.yuv_to_lab(yuv_tuple)¶

返回YUV格式的元组(y, u, v)对应的LAB格式的元组(l, a, b)。

L的范围为0到100, A和B的范围为-128到128。

备注

固件使用YUV->RGB565进程进行转换，因此此方法不会像纯YUV系统那样返回确切的值。但是，图像库在内部这样工作是正确的。

image.load_decriptor(path)¶

从磁盘上加载一个描述符对象(descriptor object).

path 是描述符文件保存的路径。

image.save_descriptor(path, descriptor)¶

保存描述符对象 descriptor 到磁盘。

path 是描述符文件保存的路径。

image.match_descriptor(descritor0, descriptor1[, threshold=70[, filter_outliers=False]])¶

对于LBP描述符来说，这个函数返回的是一个体现两个描述符之间区别的整数。这一距离测度尤为必要。这个距离是对相似度的一个度量。这个测度值越接近0，LBPF特征点匹配得就越好。

对于ORB描述符来说，这个函数返回的是``kptmatch`` 对象。见上。

threshold 是用来为ORB键点过滤不明确匹配服务的。一个较低的 threshold 值将紧扣关键点匹配算法。 threshold 值位于0-100 (int)。默认值为70。

filter_outliers 是用来为ORB键点过滤异常值服务的。特征点允许用户提高 threshold 值。默认设置为False。

HaarCascade 类 – 特征描述符¶

Haar Cascade特征描述符用于 Image.find_features() 方法。它没有供用户调用的方法。

class image.HaarCascade(path[, stages=Auto])¶

从一个Haar Cascade二进制文件（适合znzpi AI Cam的格式）加载一个Haar Cascade。如果您传递“frontalface”字符串而非一条路径，这个构造函数将会把一个内置的正脸Haar Cascade载入内存。此外，您也可以通过“eye”来把Haar Cascade载入内存。最后，这个方法会返回载入的Haar Cascade对象，用来使用 Image.find_features() 。

stages 默认值为Haar Cascade中的阶段数。然而，您可以指定一个较低的数值来加速运行特征检测器，当然这会带来较高的误报率。

备注

您可以制作自己的Haar Cascades 来配合您的znzpi AI相机使用。首先，使用谷歌搜索“<thing> Haar Cascade”，检测是否有人已经为您想要检测的对象制作了Haar Cascade。如果没有，那您需要自己动手制作（工作量巨大）。关于如何制作自己的Haar Cascade，见此关于`here <http://coding-robin.de/2013/07/22/train-your-own-opencv-haar-cascade.py>`_ 如何把Haar Cascades转化成您的znzpi AI相机可以读取的模式，见此script

问：Haar Cascade 是什么？

答：Haar Cascade是一系列用来确定一个对象是否存在于图像中的对比检查。这一系列的对比检查分成了多个阶段，后一阶段的运行以先前阶段的完成为前提。对比检查并不复杂，不过是像检查图像的中心垂直是否比边缘更轻微之类的过程。大范围的检查在前期阶段首先进行，在后期进行更多更小的区域检查。

问：Haar Cascades 是如何制作而成的？

答：Haar Cascades通过标有正负的图像对发生器算法进行训练。比如，用数百张含有猫（已被标记为内含猫）的图片和数百张不含有猫形物的图片（已作出不同标记）来训练这个生成算法。这个生成算法最后会产生一个用来检测猫的Haar Cascades。

Histogram 类 – 直方图对象¶

直方图对象是由 Image.get_histogram() 返回。灰度直方图有一个包含多个二进制的通道。

所有二进制都进行标准化，使其总和为1。

RGB565有三个包含多个二进制的通道。所有二进制都进行标准化，使其总和为1。

class image.histogram¶

请调用 Image.get_histogram() 函数来创建此对象。

bins()¶

返回灰度直方图的浮点数列表。

您也可以通过索引 [0] 取得这个值。

l_bins()¶

返回RGB565直方图LAB的L通道的浮点数列表。

您也可以通过索引 [0] 取得这个值。

a_bins()¶

返回RGB565直方图LAB的A通道的浮点数列表。

您也可以通过索引 [1] 取得这个值。

b_bins()¶

返回RGB565直方图LAB的B通道的浮点数列表。

您也可以通过索引 [2] 取得这个值。

get_percentile(percentile)¶: 计算直方图频道的CDF，返回一个 image.percentile 传递 percentile (0.0 - 1.0) (浮点数)中的直方图的值。因此，若您传入0.1，该方法会告知您，当累加入累加器时，哪一个二进制会使累加器跨过0.1。在没有异常效用破坏您的自适应色跟踪结果时，这对于确定颜色分布的最小值(0.1)和max(0.9)甚是有效。

get_threshold()¶: 使用Otsu’s 方法计算最佳阈值，将直方图分的每个通道为两半。该方法返回一个 image.threshold 对象。这个方法对确定最佳的 Image.binary() 阈值特别有用。

get_statistics()¶

计算直方图中每个颜色通道的平均值、中值、众值、标准差、最小值、最大值、下四分值和上四分值，并返回一个 statistics 对象。

您也可以使用 histogram.statistics() 和 histogram.get_stats() 作为这个方法的别名。s

Percentile 类 – 百分比值对象¶

百分比值对象由 histogram.get_percentile() 返回。

灰度百分比值有一个通道。不使用 l_*, a_* 或 b_* 方法。

RGB565百分比值有三个通道。使用 l_*, a_*, 和 b_* 方法。

class image.percentile¶

请调用 histogram.get_percentile() 函数来创建此对象。

value()¶

返回灰度百分比值（取值区间为0-255）。

您也可以通过索引 [0] 取得这个值。

l_value()¶

您也可以通过索引 [0] 取得这个值。

您也可以通过索引 [0] 取得这个值。

a_value()¶

返回RGB565 LAB 的A通道的百分比值（取值区间为-128-127）。

您也可以通过索引 [1] 取得这个值。

b_value()¶

返回RGB565 LAB 的B通道的百分比值（取值区间为-128-127）。

您也可以通过索引 [2] 取得这个值。

Threhsold 类 – 阈值对象¶

阈值对象由 histogram.get_threshold() 返回。

灰度图像有一个通道。没有 l_*, a_*, 和 b_* 方法.

RGB565 阈值有三个通道。使用 l_*, a_*, 和 b_* 方法。

class image.threshold¶

请调用 histogram.get_threshold() 函数来创建此对象。

value()¶

返回灰度图的阈值 (0 到 255)。

您也可以通过索引 [0] 取得这个值。

l_value()¶

返回RGB565图LAB中的L阈值 (between 0 and 100).

您也可以通过索引 [0] 取得这个值。

a_value()¶

返回RGB565图LAB中的A阈值 (between -128 and 127).

您也可以通过索引 [1] 取得这个值。

b_value()¶

返回RGB565图LAB中的B阈值 (between -128 and 127).

您也可以通过索引 [2] 取得这个值。

Statistics类 – 统计数据对象¶¶

统计数据对象是由 histogram.get_statistics() 或 Image.get_statistics() 返回的。

灰度统计数据有一个通道，使用非 l_*, a_* 或 b_* 方法。

RGB565百分比值有三个通道。使用 l_*, a_* 和 b_* 方法。

class image.statistics¶

请调用 histogram.get_statistics() 或 Image.get_statistics() 函数来创建此对象。

mean()¶

返回灰度均值(0-255) (int)。

您也可以通过索引 [0] 取得这个值。

median()¶

返回灰度中值(0-255) (int)。

您也可以通过索引 [1] 取得这个值。

mode()¶

返回灰度众值(0-255) (int)。

您也可以通过索引 [2] 取得这个值。

stdev()¶

返回灰度标准差(0-255) (int)。

您也可以通过索引 [3] 取得这个值。

min()¶

返回灰度最小值(0-255) (int)。

您也可以通过索引``[4]`` 取得这个值。

max()¶

Returns the grayscale max (0-255) (int).

您也可以通过索引 [5] 取得这个值。

lq()¶

返回灰度最大值(0-255) (int)。

您也可以通过索引 [6] 取得这个值。

uq()¶

返回灰度上四分值(0-255) (int)。

您也可以通过索引 [7] 取得这个值。

l_mean()¶

返回RGB5656 LAB 中L的均值(0-255) (int)。

您也可以通过索引 [0] 取得这个值。

l_median()¶

返回RGB5656 LAB 中L的中值(0-255) (int)。

您也可以通过索引 [1] 取得这个值。

l_mode()¶

返回RGB5656 LAB 中L的众值(0-255) (int)。

您也可以通过索引 [2] 取得这个值。

l_stdev()¶

返回RGB5656 LAB 中L的标准偏差值(0-255) (int)。

您也可以通过索引 [3] 取得这个值。

l_min()¶

返回RGB5656 LAB 中L的最小值(0-255) (int)。

您也可以通过索引``[4]`` 取得这个值。

l_max()¶

返回RGB5656 LAB 中L的最大值(0-255) (int)。

您也可以通过索引 [5] 取得这个值。

l_lq()¶

返回RGB5656 LAB 中L的下四分值(0-255) (int)。

您也可以通过索引 [6] 取得这个值。

l_uq()¶

返回RGB5656 LAB 中L的上四分值(0-255) (int)。

您也可以通过索引 [7] 取得这个值。

a_mean()¶

返回RGB5656 LAB 中A的均值(0-255) (int)。

您也可以通过索引 [8] 取得这个值。

a_median()¶

Returns the RGB565 LAB A median (0-255) (int).

您也可以通过索引 [9] 取得这个值。

a_mode()¶

返回RGB5656 LAB 中A的众值(0-255) (int)。

您也可以通过索引 [10] 取得这个值。

a_stdev()¶

返回RGB5656 LAB 中A的标准偏差值(0-255) (int)。

您也可以通过索引 [11] 取得这个值。

a_min()¶

返回RGB5656 LAB 中A的最小值(0-255) (int)。

您也可以通过索引 [12] 取得这个值。

a_max()¶

返回RGB5656 LAB 中A的最大值(0-255) (int)。

您也可以通过索引 [13] 取得这个值。

a_lq()¶

返回RGB5656 LAB 中A的下四分值(0-255) (int)。

您也可以通过索引 [14] 取得这个值。

a_uq()¶

返回RGB5656 LAB 中A的上四分值(0-255) (int)。

您也可以通过索引 [15] 取得这个值。

b_mean()¶

返回RGB5656 LAB 中B的均值(0-255) (int)。

您也可以通过索引 [16] 取得这个值。

b_median()¶

返回RGB5656 LAB 中B的中值(0-255) (int)。

您也可以通过索引 [17] 取得这个值。

b_mode()¶

返回RGB5656 LAB 中B的众值(0-255) (int)。

您也可以通过索引 [18] 取得这个值。

b_stdev()¶

返回RGB5656 LAB 中B的标准差值(0-255) (int)。

您也可以通过索引 [19] 取得这个值。

b_min()¶

返回RGB5656 LAB 中B的最小值(0-255) (int)。

您也可以通过索引 [20] 取得这个值。

b_max()¶

返回RGB5656 LAB 中B的最大值(0-255) (int)。

您也可以通过索引 [21] 取得这个值。

b_lq()¶

返回RGB5656 LAB 中B的下四分值(0-255) (int)。

您也可以通过索引 [22] 取得这个值。

b_uq()¶

返回RGB5656 LAB 中B的上四分值(0-255) (int)。

您也可以通过索引 [23] 取得这个值。

Blob 类 – 色块对象¶

色块对象是由 Image.find_blobs() 返回的。

class image.blob¶

请调用 Image.find_blobs() 函数来创建此对象。

corners()¶: 返回对象的4个角的4 (x,y)元组列表。从左上方开始按顺时针顺序返回角。

min_corners()¶: 返回包含4个角的4 (x,y)元组的列表，该元组的边界大于该Blob的最小面积矩形的边界。与 blob.corners() 不同，最小面积矩形的角并不一定位于blob上。

rect()¶: 返回一个矩形元组(x, y, w, h) ，用于如色块边界框的 Image.draw_rectangle() 等其他的 image 方法。

x()¶

返回色块的边界框的x坐标(int)。

您也可以通过索引 [0] 取得这个值。

y()¶

返回色块的边界框的y坐标(int)。

您也可以通过索引 [1] 取得这个值。

w()¶

返回色块的边界框的w坐标(int)。

您也可以通过索引 [2] 取得这个值。

h()¶

返回色块的边界框的h坐标(int)。

您也可以通过索引 [3] 取得这个值。

pixels()¶

返回从属于色块(int)一部分的像素数量。

您也可以通过索引``[4]`` 取得这个值。

cx()¶

返回色块(int)的中心x位置。

您也可以通过索引 [5] 取得这个值。

cxf()¶: 返回blob(浮点数)的质心x位置。

cy()¶

返回色块(int)的中心y位置。

您也可以通过索引 [6] 取得这个值。

cyf()¶: 回blob(浮点数)的质心y位置。”

rotation()¶

返回色块的旋转（单位：弧度）。如果色块类似铅笔或钢笔，那么这个值就是介于0-180之间的唯一值。如果这个色块圆的，那么这个值就没有效用。

您也可以通过索引 [7] 取得这个值。

rotation_deg()¶: 以度为单位返回blob的旋转角度。

rotation_rad()¶: 以弧度为单位返回blob的旋转度数。这个方法比 blob.rotation() 更具描述性。

code()¶

返回一个32位的二进制数字，其中为每个颜色阈值设置一个位，这是色块的一部分。例如，如果您通过 Image.find_blobs() 来寻找三个颜色阈值，这个色块可以设置为0/1/2位。注意：除非以 merge=True 调用 Image.find_blobs() ，否则每个色块只能设置一位。那么颜色阈值不同的多个色块就可以合并在一起了。您也可以用这个方法以及多个阈值来实现颜色代码跟踪。

您也可以通过索引 [8] 取得这个值。

count()¶

返回合并到此Blob中的Blob数。只有您以 merge=True 调用 Image.find_blobs() 时，这个数字才不是1。

您也可以通过索引 [9] 取得这个值。

perimeter()¶: 返回该blob周长上的像素数。

roundness()¶: 返回0到1之间的值，表示对象的圆度。一个圆将是1。

elongation()¶: 返回一个介于0和1之间的值，该值表示对象的长度（不是圆形）。一条线将是1。

area()¶: 返回色块周围的边框面积(w * h)

density()¶: 返回这个色块的密度比。这是在色块边界框区域内的像素点的数量。总的来说，较低的密度比意味着这个对象的锁定得不是很好。结果在0和1之间。

extent()¶: 是 blob.density() 的别名。

compactness()¶: 类似 blob.density() ，但是，使用blob的周长来衡量对象的密度，因此更准确。结果在0和1之间。

solidity()¶: 类似 blob.density() ，但是，使用旋转的最小面积矩形与边界矩形来衡量密度。结果在0和1之间。

convexity()¶: 返回一个0到1之间的值，表示对象的凸度。正方形是1。

x_hist_bins()¶: 返回blob中所有列的x轴直方图。Bin值在0和1之间缩放。

y_hist_bins()¶: 返回blob中所有行的y轴直方图。Bin值在0和1之间缩放。

major_axis_line()¶: 返回blob的主轴(这条线穿过最小面积矩形的最长边)的行元组(x1, y1, x2, y2)，可以使用 Image.draw_line() 来绘制它。

minor_axis_line()¶: 返回blob的次轴(这条线穿过最小面积矩形的最短边)的行元组(x1, y1, x2, y2)，可以使用 Image.draw_line() 来绘制它。

enclosing_circle()¶: 返回一个圆（包围blob的最小面积矩形的圆）元组(x, y, r)，可以使用 Image.draw_circle() 来绘制它。

enclosed_ellipse()¶: 返回一个椭圆（包围blob的最小面积矩形的椭圆）元组(x, y, rx, ry, rotation)，可以使用 Image.draw_ellipse() 来绘制它。

Line类 – 直线对象¶

直线对象是由 Image.find_lines() , Image.find_line_segments() 或 Image.get_regression() 返回的。

class image.line¶

请调用 Image.find_lines() , Image.find_line_segments() , 或 Image.get_regression() 函数来创建此对象。

line()¶: 返回一个直线元组(x1, y1, x2, y2) ，用于如 Image.draw_line() 等其他的 image 方法。

x1()¶

返回直线的p1顶点 x坐标分量。

您也可以通过索引 [0] 取得这个值。

y1()¶

返回直线的p1 y分量。

您也可以通过索引 [1] 取得这个值。

x2()¶

返回直线的p2 x分量。

您也可以通过索引 [2] 取得这个值。

y2()¶

返回直线的p2 y分量。

您也可以通过索引 [3] 取得这个值。

length()¶

返回直线长度即 sqrt(((x2-x1)^2) + ((y2-y1)^2).

您也可以通过索引``[4]`` 取得这个值。

magnitude()¶

返回霍夫变换后的直线的模(magnitude)。

您也可以通过索引 [5] 取得这个值。

theta()¶

返回霍夫变换后的直线的角度（0-179度）。

您也可以通过索引 [7] 取得这个值。

rho()¶

返回霍夫变换后的直线p值。

您也可以通过索引 [8] 取得这个值。

Circle类 – 圆形对象¶

圆形对象是由 Image.find_circles() 返回的。

class image.circle¶

请调用 Image.find_circles() 函数来创建此对象。

x()¶

返回圆的x位置。

您也可以通过索引 [0] 取得这个值。

y()¶

返回圆的y位置。

您也可以通过索引 [1] 取得这个值。

r()¶

返回圆的半径。

您也可以通过索引 [2] 取得这个值。

magnitude()¶

返回圆的模(magnitude)。

您也可以通过索引 [3] 取得这个值。

Rect类 – 矩形对象¶

矩形对象是由 Image.find_rects() 返回的。

class image.rect¶

请调用 Image.find_rects() 函数来创建此对象。

corners()¶: 返回对象的4个角的4 (x,y)元组列表。从左上方开始按顺时针顺序返回角。

rect()¶: 返回一个矩形元组(x, y, w, h)，用于如矩形的边界框的 Image.draw_rectangle() 等其他的 image 方法。

x()¶

返回矩形的左上角的x位置。

您也可以通过索引 [0] 取得这个值。

y()¶

返回矩形的左上角的y位置。

您也可以通过索引 [1] 取得这个值。

w()¶

返回矩形的宽度。

您也可以通过索引 [2] 取得这个值。

h()¶

返回矩形的高度。

您也可以通过索引 [3] 取得这个值。

magnitude()¶

返回矩形的模(magnitude)。

您也可以通过索引``[4]`` 取得这个值。

QRCode类 – 二维码对象¶

二维码对象是由 Image.find_qrcodes() 返回的。

class image.qrcode¶

请调用 Image.find_qrcodes() 函数来创建此对象。

corners()¶: 返回对象的4个角的4 (x,y)元组列表。从左上方开始按顺时针顺序返回角。

rect()¶: 返回一个矩形元组(x, y, w, h)，用于如二维码的边界框的 Image.draw_rectangle() 等其他的 image 方法。

x()¶

返回二维码的边界框的x坐标(int)。

您也可以通过索引 [0] 取得这个值。

y()¶

返回二维码的边界框的y坐标(int)。

您也可以通过索引 [1] 取得这个值。

w()¶

返回二维码的边界框的w坐标(int)。

您也可以通过索引 [2] 取得这个值。

h()¶

返回二维码的边界框的h坐标(int)。

您也可以通过索引 [3] 取得这个值。

payload()¶

返回二维码有效载荷的字符串，例如URL 。

您也可以通过索引``[4]`` 取得这个值。

version()¶

返回二维码的版本号(int)。

您也可以通过索引 [5] 取得这个值。

ecc_level()¶

返回二维码的ECC水平(int)。

您也可以通过索引 [6] 取得这个值。

mask()¶

返回二维码的掩码(int)。

您也可以通过索引 [7] 取得这个值。

data_type()¶

返回二维码的数据类型。

您也可以通过索引 [8] 取得这个值。

eci()¶

返回二维码的ECI。ECI储存了QR码中存储数据字节的编码。若您想要处理包含超过标准ASCII文本的二维码，您需要查看这一数值。

您也可以通过索引 [9] 取得这个值。

is_numeric()¶: 若二维码的数据类型为数字式，则返回True。

is_alphanumeric()¶: 若二维码的数据类型为文字数字式，则返回True。

is_binary()¶: 若二维码的数据类型为二进制式，则返回True。如果您认真处理所有类型的文本，则需要检查eci是否为True，以确定数据的文本编码。通常它只是标准的ASCII，但是它也可能是有两个字节字符的UTF8。

is_kanji()¶: 若二维码的数据类型为日本汉字，则返回True。设置为True后，您就需要自行解码字符串，因为日本汉字符号每个字符是10位，而MicroPython不支持解析这类文本。

AprilTag类 – AprilTag对象¶

AprilTag对象是由 Image.find_apriltags() 返回的。

class image.apriltag¶

请调用 Image.find_apriltags() 函数来创建此对象。

corners()¶: 返回对象的4个角的4 (x,y)元组列表。从左上方开始按顺时针顺序返回角。

rect()¶: 返回一个矩形元组(x, y, w, h)，用于如AprilTag边界框的 Image.draw_rectangle() 等其他的 image 方法。

x()¶

返回AprilTag边界框的x坐标(int)。

您也可以通过索引 [0] 取得这个值。

y()¶

返回AprilTag边界框的y坐标(int)。

您也可以通过索引 [1] 取得这个值。

w()¶

返回AprilTag边界框的w坐标(int)。

您也可以通过索引 [2] 取得这个值。

h()¶

返回AprilTag边界框的h坐标(int)。

您也可以通过索引 [3] 取得这个值。

id()¶

返回AprilTag的数字ID。

TAG16H5 -> 0 to 29

TAG25H7 -> 0 to 241

TAG25H9 -> 0 to 34

TAG36H10 -> 0 to 2319

TAG36H11 -> 0 to 586

ARTOOLKIT -> 0 to 511

您也可以通过索引``[4]`` 取得这个值。

family()¶

返回AprilTag的数字族。

image.TAG16H5

image.TAG25H7

image.TAG25H9

image.TAG36H10

image.TAG36H11

image.ARTOOLKIT

您也可以通过索引 [5] 取得这个值。

cx()¶: 返回AprilTag的中心x位置(int)。

cxf()¶

返回AprilTag的中心y位置(float)。

您也可以通过索引 [6] 取得这个值。

cy()¶: 返回AprilTag的中心y位置(int)。

cyf()¶

返回AprilTag的中心y位置(float)。

您也可以通过索引 [7] 取得这个值。

rotation()¶

返回以弧度计的AprilTag的旋度(float)。

您也可以通过索引 [8] 取得这个值。

decision_margin()¶

返回AprilTag匹配的色饱和度（取值0.0 - 1.0），其中1.0为最佳。

您也可以通过索引 [9] 取得这个值。

hamming()¶

返回AprilTag的可接受的数位误差数值。

TAG16H5 -> 0 bit errors will be accepted

TAG25H7 -> up to 1 bit error may be accepted

TAG25H9 -> up to 3 bit errors may be accepted

TAG36H10 -> up to 3 bit errors may be accepted

TAG36H11 -> up to 4 bit errors may be accepted

ARTOOLKIT -> 0 bit errors will be accepted

您也可以通过索引 [10] 取得这个值。

goodness()¶

返回AprilTag图像的色饱和度（取值0.0 - 1.0），其中1.0为最佳。

备注

目前这一数值通常是0.0。未来我们可以启用一个称为“标签细化”的功能，以实现对更小的AprilTag的检测。然而，现在这个功能将帧速率降低到1 FPS以下。

您也可以通过索引 [11] 取得这个值。

x_translation()¶

返回距离摄像机x方向的变换，距离的单位未知。

这个方法对于确定远离摄像机的AprilTag的位置很有用。但是，AprilTag的大小以及您使用的镜头等因素都会影响X单元归属的确定。为使用方便，我们推荐您使用查找表将该方法的输出转换为对您的应用程序有用的信息。

注意：此处的方向为从左至右。

您也可以通过索引 [12] 取得这个值。

y_translation()¶

返回距离摄像机y方向的变换，距离的单位未知。

这个方法对于确定远离摄像机的AprilTag的位置很有用。但是，AprilTag的大小以及您使用的镜头等因素都会影响Y单元归属的确定。为使用方便，我们推荐您使用查找表将该方法的输出转换为对您的应用程序有用的信息。

注意：此处的方向为从上至下。

您也可以通过索引 [13] 取得这个值。

z_translation()¶

返回距离摄像机z方向的变换，距离的单位未知。

T这个方法对于确定远离摄像机的AprilTag的位置很有用。但是，AprilTag的大小以及您使用的镜头等因素都会影响Z单元归属的确定。为使用方便，我们推荐您使用查找表将该方法的输出转换为对您的应用程序有用的信息。

注意：此处的方向为从前至后。

您也可以通过索引 [14] 取得这个值。

x_rotation()¶

返回以弧度计的AprilTag在X平面上的旋度。例：目视AprilTag，从左至右移动摄像头。

您也可以通过索引 [15] 取得这个值。

y_rotation()¶

返回以弧度计的AprilTag在Y平面上的旋度。例：目视AprilTag，从上至下移动摄像头。

您也可以通过索引 [16] 取得这个值。

z_rotation()¶

返回以弧度计的AprilTag在Z平面上的旋度。例：目视AprilTag，旋转摄像头。

注意：这只是 apriltag.rotation() 的重命名版本。

您也可以通过索引 [17] 取得这个值。

DataMatrix类– 数据矩阵对象¶

数据矩阵对象是由 Image.find_datamatrices() 返回的。

class image.datamatrix¶

请调用 Image.find_datamatrices() 函数来创建此对象。

corners()¶: 返回对象的4个角的4 (x,y)元组列表。从左上方开始按顺时针顺序返回角。

rect()¶: 返回一个矩形元组(x, y, w, h)，用于如数据矩阵的边界框的 Image.draw_rectangle() 等其他的 image 方法。

x()¶

返回数据矩阵的边界框的x坐标(int)。

您也可以通过索引 [0] 取得这个值。

y()¶

返回数据矩阵的边界框的y坐标(int)。

您也可以通过索引 [1] 取得这个值。

w()¶

返回数据矩阵的边界框的w宽度

您也可以通过索引 [2] 取得这个值。

h()¶

返回数据矩阵的边界框的h高度。

您也可以通过索引 [3] 取得这个值。

payload()¶

返回数据矩阵的有效载荷的字符串。例：字符串。

您也可以通过索引``[4]`` 取得这个值。

rotation()¶

返回以弧度计的数据矩阵的旋度(浮点数)。

您也可以通过索引 [5] 取得这个值。

rows()¶

返回数据矩阵的行数(int)。

您也可以通过索引 [6] 取得这个值。

columns()¶

返回数据矩阵的列数(int)。

您也可以通过索引 [7] 取得这个值。

capacity()¶

返回这一数据矩阵所能容纳的字符的数量。

您也可以通过索引 [8] 取得这个值。

padding()¶

返回这一数据矩阵中未使用的字符的数量。

您也可以通过索引 [9] 取得这个值。

BarCode类 –条形码对象¶

条形码对象是由 Image.find_barcodes() 返回的。

class image.barcode¶

请调用 Image.find_barcodes() 函数来创建此对象。

corners()¶: 返回对象的4个角的4 (x,y)元组列表。从左上方开始按顺时针顺序返回角。

rect()¶: 返回一个矩形元组(x, y, w, h)，用于如数据矩阵的边界框的 Image.draw_rectangle() 等其他的 image 方法。

x()¶

返回条形码的边界框的x坐标(int)。

您也可以通过索引 [0] 取得这个值。

y()¶

返回条形码的边界框的y坐标(int)。

您也可以通过索引 [1] 取得这个值。

w()¶

返回条形码的边界框的w宽度(int)。

您也可以通过索引 [2] 取得这个值。

h()¶

返回条形码的边界框的h高度(int)。

您也可以通过索引 [3] 取得这个值。

payload()¶

返回条形码的有效载荷的字符串。例：数量。

您也可以通过索引``[4]`` 取得这个值。

type()¶

返回条形码的列举类型 (int)。

您也可以通过索引 [5] 取得这个值。

image.EAN2

image.EAN5

image.EAN8

image.UPCE

image.ISBN10

image.UPCA

image.EAN13

image.ISBN13

image.I25

image.DATABAR

image.DATABAR_EXP

image.CODABAR

image.CODE39

image.PDF417 - Future (e.g. doesn’t work right now).

image.CODE93

image.CODE128

rotation()¶

返回以弧度计的条形码的旋度(浮点数)。

您也可以通过索引 [6] 取得这个值。

quality()¶

返回条形码在图像中被检测到的次数(int)。

扫描条形码时，每一条新的扫描线都能解码相同的条形码。每次进行这一过程，条形码的值都会随之增加。

您也可以通过索引 [7] 取得这个值。

Displacement类 – 位移对象¶

位移对象由 Image.find_displacement() 返回。

class image.displacement¶

请调用 Image.find_displacement() 函数来创建此对象。

x_translation()¶

返回两个图像之间的x平移像素。这是精确的子像素，所以它是一个浮点数。

您也可以通过索引 [0] 取得这个值。

y_translation()¶

返回两个图像之间的y平移像素。这是精确的子像素，所以它是一个浮点数。

您也可以通过索引 [1] 取得这个值。

rotation()¶

返回两个图像之间旋转的弧度。

您也可以通过索引 [2] 取得这个值。

scale()¶

返回两个图像之间缩放变化。

您也可以通过索引 [3] 取得这个值。

response()¶

返回两幅图像之间位移匹配结果的质量。范围 0-1。响应小于0.1的 displacement 对象可能是噪声。

您也可以通过索引``[4]`` 取得这个值。

Kptmatch类 – 特征点对象¶

特征点对象是由 image.match_descriptor() 返回的。

class image.kptmatch¶

请调用 image.match_descriptor() 函数来创建此对象。

rect()¶: 返回一个矩形元组(x, y, w, h)，用于如特征点的边界框的 Image.draw_rectangle() 等其他的 image 方法。

cx()¶

返回特征点的中心x位置(int)。

您也可以通过索引 [0] 取得这个值。

cy()¶

返回特征点的中心y位置(int)。

您也可以通过索引 [1] 取得这个值。

x()¶

返回特征点边界框的x坐标(int)。

您也可以通过索引 [2] 取得这个值。

y()¶

返回特征点边界框的y坐标(int)。

您也可以通过索引 [3] 取得这个值。

w()¶

返回特征点边界框的w宽度(int)。

您也可以通过索引``[4]`` 取得这个值。

h()¶

返回特征点边界框的h高度(int)。

您也可以通过索引 [5] 取得这个值。

count()¶

返回匹配的特征点的数量(int)。

您也可以通过索引 [6] 取得这个值。

theta()¶

返回估计的特征点的旋度(int)。

您也可以通过索引 [7] 取得这个值。

match()¶

返回匹配关键点的(x，y)元组列表。

您也可以通过索引 [8] 取得这个值。

ImageIO – ImageIO 对象¶

ImageIO 对象允许您以原生形式将 znzpi Image 对象读/写到磁盘或内存。此类为加载/存储图像提供快速读/写随机访问。

class image.ImageIO(path, mode)¶

创建一个 ImageIO 对象。

如果 path 是磁盘上的文件名，那么如果 mode 是 'r' 将打开该文件进行读取，如果 mode 是 'w' 则写。

path 也可以是一个 3 值元组 (w, h, bpp) 用于图像的内存存储。在这种情况下，mode 是要存储在内存中的图像缓冲区的数量。请注意，内存中的存储缓冲区在分配后不允许增加大小。二进制图像使用 bpp 值 0，灰度图像使用 1，rgb565 图像使用 2。

type()¶: 返回 ImageIO 对象是否是 FILE_STREAM 或 MEMORY_STREAM 。

is_closed()¶: 返回 ImageIO 对象是否被关闭或不在使用

count()¶: 返回存储的帧数。

offset()¶: 返回图像的索引偏移。

version()¶: 返回对象的遍布是否是 FILE_STREAM. MEMORY_STREAM none

buffer_size()¶

返回在单缓存上为帧对象分配的大小。

buffer_size() * count() == size()

size()¶: 返回 ImageIO 对象使用的磁盘或内存上的字节数。

write(img)¶

将新图像 img 写入 ImageIO 对象。对于磁盘 ImageIO 对象，该文件将随着新图像的添加而增长。对于内存中的 ImageIO 对象，这只是在前进到下一个位置之前将图像写入当前预分配的位置。

返回 ImageIO 对象。

read([copy_to_fb=False[, loop=True[, pause=True]]])¶

从 ImageIO 对象返回一个图像对象。如果 copy_to_fb 为 False，则新图像将在 MicroPython 堆上分配。但是，MicroPython 堆是有限的，如果耗尽，可能没有空间来存储新图像。相反，将 copy_to_fb 设置为 True 以将帧缓冲区设置为新图像，从而使该函数像 sensor.snapshot() 一样工作。

loop 如果为 True 会自动使 ImageIO 对象在图像流的末尾寻找开头。

pause 如果为 True ，则此方法通过写入先前记录的毫秒数暂停，以匹配捕获图像数据的原始帧速率。

seek(offset)¶

寻找 ImageIO 对象中的图像位置偏移 offset 。

工作于磁盘或内存对象上。

sync()¶: 将多有 ImageIO对象到磁盘。

close()¶: 关闭 ImageIO 对象。对于内存对象，这是释放分配的空间，对于磁盘文件，这将关闭文件并写出所有元数据。

FILE_STREAM¶: ImageIO 对象打开于文件

MEMORY_STREAM¶: ImageIO 对象打开于内存

Image类 – 图像对象¶

图像对象是机器视觉操作的基本对象。

class image.Image(path[, buffer=None[, copy_to_fb=False]])¶

用 path 指向的文件创建一个图像对象。或者，您可以传递一个宽度、高度 width, height, 和 image.GRAYSCALE, 或 sensor.RGB565 来创建新的空白图像对象(初始化为0 -黑色)。

支持bmp/pgm/ppm/jpg/jpeg格式的图像文件。

若 copy_to_fb 为True，图像会直接载入帧缓冲区，您就可以加载大幅图片了。若为False，图像会载入MicroPython的堆中，堆远比帧缓冲区小。

buffer 可以设置为任何用来数据源的缓存对象。例如，如果你想通过一个图像的 bytes() 或 bytearray() 来创建一个JPEG图像，你可以通过设置JPEG的 width, height, image.JPEG buffer 来设置JPEG字节流来创建JPEG image。最后，注意这个图像时缓存本身。

图像支持“[]”记法。令 image[index] = 8/16-bit value ，以便分配图像像素或 image[index] ，并得到一个图像像素，若是用于RGB图像的16位RGB565值的灰度图像，这一像素则为8位。

对于JPEG图像而言，“[]”使得您可以访问压缩的节数组形式的JPEG图像色块。由于JPEG图像是压缩的字节流形式，因而对数据组的读取和写入是不透明的。

图像还支持读缓冲区操作。您可以把图像当作节数组对象，将图像输入所有类型的MicroPython函数。若您想传送一个图像，可以将它传递给UART /SPI/ I2C写入函数，可实现自动传送。

width()¶: 返回以像素计的图像的宽度。

height()¶: 返回以像素计的图像的高度。

format()¶: 返回用于灰度图的 image.GRAYSCALE 、用于RGB图像的 image.RGB565 和 image.BAYER 用于JPEG图像的 image.JPEG 。

size()¶: 返回以字节计的图像大小。

bytearray()¶: 返回一个 bytearray 对象，该对象指向图像数据以便进行字节级读/写访问。

备注

当传递给需要类似 bytes 对象的 MicroPython 驱动程序时，图像对象会自动转换为 bytes 对象。这是只读访问。调用 bytearray() 来获得读/写访问权限。

get_pixel(x, y[, rgbtuple])¶

灰度图：返回(x, y)位置的灰度像素值。RGB565l：返回(x, y)位置的RGB888像素元组(r, g, b)。Bayer图像: 返回(x, y)位置的像素值。不支持压缩图像。

如果 x 或 y 超出image，则返回None

x 和 y 可以独立传递，也可以作为元组传递。

rgbtuple if True causes this method to return an RGB888 tuple. Otherwise, this method returns the integer value of the underlying pixel. I.e. for RGB565 images this method returns a RGB565 value. Defaults to True for RGB565 images and False otherwise.

不支持压缩图像

备注

Image.get_pixel() 和 Image.set_pixel() 是允许你操作Bayer模式图像的唯一方法。 Bayer模式图像是文字图像。对于偶数行，其中图像中的像素是R/G/R/G/等。对于奇数行，其中图像中的像素是G/B/G/B/等。 rgbtuple 每个像素是8位。 Image.get_pixel()

set_pixel(x, y, pixel)¶

灰度图：将(x, y) 位置的像素设置为灰度值 pixel 。 RGB图像：将(x, y) 位置的像素设置为RGB888元组(r, g, b) pixel 。对于bayer模式图像:将位置(x, y)的像素值设置为 pixel。

返回image对象，你可以用 . 调用其实现的其他的方法

x 和 y 可以独立传递，也可以作为元组传递。

pixel 可以是 RGB888 元组 (r, g, b) 或底层像素值（即 RGB565 图像的字节反转 RGB565 值或灰度图像的 8 位值。

不支持压缩图像

备注

Image.get_pixel() 和 Image.set_pixel() 是允许你操作Bayer模式图像的唯一方法。 Bayer模式图像是文字图像。对于偶数行，其中图像中的像素是R/G/R/G/等。对于奇数行，其中图像中的像素是G/B/G/B/等。每个像素是8位。

mean_pool(x_div, y_div)¶

在图像中找到 x_div * y_div 正方形的平均值，并返回由每个正方形的平均值组成的修改图像。

此方法允许您在原来图像上快速缩小图像。

不支持压缩图像和bayer图像。

mean_pooled(x_div, y_div)¶

在图像中找到 x_div * y_div 正方形的平均值，并返回由每个正方形的平均值组成的新图像。

此方法允许您创建缩小的图像副本。

不支持压缩图像和bayer图像。

midpoint_pool(x_div, y_div[, bias=0.5])¶

在图像中找到 x_div * y_div 正方形的中点值，并返回由每个正方形的中点值组成的修改图像。

bias 为0.0返回每个区域的最小值，而 bias 为1.0返回每个区域的最大值。

此方法允许您在原来图像上快速缩小图像。

不支持压缩图像和bayer图像。

midpoint_pooled(x_div, y_div[, bias=0.5])¶

在图像中找到 x_div * y_div 正方形的中点值，并返回由每个正方形的中点值组成的新图像。

bias 为0.0返回每个区域的最小值，而 bias 为1.0返回每个区域的最大值。

此方法允许您创建缩小的图像副本。

不支持压缩图像和bayer图像。

to_bitmap([x_scale=1.0[, y_scale=1.0[, roi=None[, rgb_channel=-1[, alpha=256[, color_palette=None[, alpha_palette=None[, hint=0[, copy=False]]]]]]]]])¶

将图像转换为位图图像（每像素 1 位）。如果 copy 为 False，此方法将尝试就地修改图像。如果 copy 为 True，则此方法将返回在堆上分配的新图像副本。

copy 也可能是另一个图像对象，在这种情况下，此方法将尝试重新使用该图像对象存储空间，并返回一个使用先前图像对象存储空间的新图像对象。执行此操作后，不要再使用对旧图像对象的任何引用，因为它们将过时。

x_scale 控制在水平方向显示图像的缩放参数(浮点数)。如果是负值则进行水平镜像。注意如果没有指定``y_scale`` 则使用 x_scale 来保持纵横比。

y_scale 控制在垂直方向显示图像的缩放参数(浮点数)。如果是负值则进行垂直翻转。注意如果没有指定``x_scale`` 则使用 y_scale 来保持纵横比。

roi 是要绘制的源图像的感兴趣区域矩形元组 (x, y, w, h)。这允许您仅提取 ROI 中的像素以在目标图像上进行缩放和绘制。

rgb_channel 是从 RGB565 图像（如果传递）中提取并渲染到目标图像上的 RGB 通道（0=R，G=1，B=2）。例如，如果您传递 rgb_channel=1 这将提取源 RGB565 图像的绿色通道并在目标图像上以灰度方式绘制。

alpha 控制要混合到目标图像中的源图像的多少。值为 256 时绘制不透明的源图像，而小于 256 的值会在源图像和目标图像之间产生混合。 0 不会修改目标图像。

color_palette 如果不是 -1 可以是 image.PALETTE_RAINBOW 、image.PALETTE_IRONBOW ，或总共 256 像素的 RGB565 图像，用作任何来源灰度值的颜色查找表图像。如果使用，这将在 rgb_channel 提取之后应用。

alpha_palette 如果不是 -1 可以是总共 256 像素的灰度图像，用作 alpha 调色板，以像素级别调制正在绘制的源图像的 alpha 值，允许您根据像素的灰度值精确控制像素的 alpha 值。 alpha 查找表中的 255 像素值是不透明的，任何小于 255 的像素值都会变得更透明，直到 0。如果使用，则在 rgb_channel 提取之后应用。

hint 为一个逻辑或标志:

image.AREA: 近邻插值缩小使用的面积参数

image.BILINEAR: 近邻插值的线性缩放。

image.BICUBIC ：近邻插值的双立方缩放

image.CENTER: 显示图像置中，在缩放后使用。

image.HMIRROR ：水平镜像图像

image.VFLIP : 垂直翻转图像

image.TRANSPOSE : 旋转图像(交换x/y)

image.EXTRACT_RGB_CHANNEL_FIRST : 在缩放前抽取RGB通道。

image.APPLY_COLOR_PALETTE_FIRST : 做法前使用调色板。

image.SCALE_ASPECT_KEEP : 缩放图像以使用显示。

image.SCALE_ASPECT_EXPAND : 缩放图像以适应显示(剪切)

image.SCALE_ASPECT_IGNORE : 缩放图像以适应显示(伸展)

image.ROTATE_90 : 图像旋转90度(即 VFLIP | TRANSPOSE)

image.ROTATE_180 : 图像180度旋转(即 HMIRROR | VFLIP)

image.ROTATE_270 : 图像旋转270度(即 HMIRROR | TRANSPOSE)

备注

位图图像就像只有两个像素值（0和1）的灰度图像一样。此外，位图图像被打包，这样它们每个像素仅存储1位，因此非常小。 znzpi图像库允许位图图像在所有位置的 sensor.GRAYSCALE 和 sensor.RGB565 中使用。但是，将许多操作应用于位图图像时没有任何意义，因为位图图像只有2个值。 znzpi建议在操作中对 mask 值使用位图图像，因为它们很容易适合MicroPython堆。最后，将位图图像像素值0和1应用于 sensor.GRAYSCALE 或 sensor.RGB565 图像时，将被解释为黑白。该库自动处理转换。

返回image对象，你可以用 . 调用其实现的其他的方法

to_grayscale([x_scale=1.0[, y_scale=1.0[, roi=None[, rgb_channel=-1[, alpha=256[, color_palette=None[, alpha_palette=None[, hint=0[, copy=False]]]]]]]]])¶

将图像转换为灰度图像（每像素 8 位）。如果 copy 为 False，此方法将尝试就地修改图像。如果 copy 为 True，则此方法将返回在堆上分配的新图像副本。