python实现简单图片物体标注工具

发布时间：2024/01/26

我们来详细讲解一下“Python实现简单图片物体标注工具”的完整攻略。

1. 确定需求

在开始开发之前，我们首先需要明确自己的需求，也就是要实现一个什么样的图片物体标注工具。我们需要考虑一下以下问题：

我们需要标注什么样的物体？
标注的信息是否需要保存到文件中？
是否需要对标注后的图片进行展示？

2. 准备工作

在开始编写代码之前，我们需要先准备一些需要用到的工具和第三方库：

Python 3.x
ImageTk 和 Pillow：用于处理图片和图形界面。
tkinter：用于实现图形界面。
XML 解析器：用于解析 XML 文件。

3. 编写代码

现在我们可以开始编写我们的代码了。在这个过程中，我们需要分为以下几个步骤：

加载图片
标注物体
保存标注信息

为了更好地说明，我们将给出两个具体的示例。

示例一：标注狗

在这个示例中，我们将标注一张狗的图片。具体步骤如下：

打开“狗.jpg”图片。

from PIL import Image, ImageTk

image = Image.open("dog.jpg")

在图片上标注狗的区域。

在这个示例中，我们使用矩形来标注狗的区域。使用鼠标在图片上拖动并释放鼠标即可绘制出矩形。

from tkinter import Tk, Canvas, Button, messagebox

# 创建一个 canvas 对象用于在上面绘制狗的区域
canvas = Canvas(root, width=image.width, height=image.height)
canvas.pack()

# 监听鼠标事件
def on_button_press(event):
    global start_x, start_y, current_rect
    start_x = canvas.canvasx(event.x)
    start_y = canvas.canvasy(event.y)
    current_rect = canvas.create_rectangle(start_x, start_y, start_x, start_y, outline="red", width=2)

def on_move_press(event):
    global start_x, start_y, current_rect
    canvas.delete(current_rect)
    end_x = canvas.canvasx(event.x)
    end_y = canvas.canvasy(event.y)
    current_rect = canvas.create_rectangle(start_x, start_y, end_x, end_y, outline="red", width=2)

canvas.bind("<ButtonPress-1>", on_button_press)
canvas.bind("<B1-Motion>", on_move_press)

保存标注信息

在这里，我们将使用 XML 文件来保存标注信息。我们需要将狗的位置和大小保存到 XML 文件中。

import xml.etree.ElementTree as ET

# 保存标注信息
def save():
    # 创建根节点
    root = ET.Element("annotation")

    # 创建子节点
    filename = ET.SubElement(root, "filename")
    filename.text = "dog.jpg"

    size = ET.SubElement(root, "size")
    width = ET.SubElement(size, "width")
    width.text = str(image.width)
    height = ET.SubElement(size, "height")
    height.text = str(image.height)
    depth = ET.SubElement(size, "depth")
    depth.text = str(3)

    object = ET.SubElement(root, "object")
    name = ET.SubElement(object, "name")
    name.text = "dog"
    bndbox = ET.SubElement(object, "bndbox")
    xmin = ET.SubElement(bndbox, "xmin")
    xmin.text = str(start_x)
    ymin = ET.SubElement(bndbox, "ymin")
    ymin.text = str(start_y)
    xmax = ET.SubElement(bndbox, "xmax")
    xmax.text = str(end_x)
    ymax = ET.SubElement(bndbox, "ymax")
    ymax.text = str(end_y)

    # 写入 XML 文件
    tree = ET.ElementTree(root)
    tree.write("dog.xml")

# 添加保存按钮
save_button = Button(root, text="保存", command=save)
save_button.pack()

示例二：标注苹果

在这个示例中，我们将标注一张苹果的图片。具体步骤如下：

打开“苹果.jpg”图片。

from PIL import Image, ImageTk

image = Image.open("apple.jpg")

在图片上标注苹果的区域。

这个示例中，我们依然使用矩形来标注苹果的区域。使用鼠标在图片上拖动并释放鼠标即可绘制出矩形。

from tkinter import Tk, Canvas, Button, messagebox

# 创建一个 canvas 对象用于在上面绘制苹果的区域
canvas = Canvas(root, width=image.width, height=image.height)
canvas.pack()

# 监听鼠标事件
def on_button_press(event):
    global start_x, start_y, current_rect
    start_x = canvas.canvasx(event.x)
    start_y = canvas.canvasy(event.y)
    current_rect = canvas.create_rectangle(start_x, start_y, start_x, start_y, outline="green", width=2)

def on_move_press(event):
    global start_x, start_y, current_rect
    canvas.delete(current_rect)
    end_x = canvas.canvasx(event.x)
    end_y = canvas.canvasy(event.y)
    current_rect = canvas.create_rectangle(start_x, start_y, end_x, end_y, outline="green", width=2)

canvas.bind("<ButtonPress-1>", on_button_press)
canvas.bind("<B1-Motion>", on_move_press)

保存标注信息

同样，我们需要将苹果的位置和大小保存到 XML 文件中。

import xml.etree.ElementTree as ET

# 保存标注信息
def save():
    # 创建根节点
    root = ET.Element("annotation")

    # 创建子节点
    filename = ET.SubElement(root, "filename")
    filename.text = "apple.jpg"

    size = ET.SubElement(root, "size")
    width = ET.SubElement(size, "width")
    width.text = str(image.width)
    height = ET.SubElement(size, "height")
    height.text = str(image.height)
    depth = ET.SubElement(size, "depth")
    depth.text = str(3)

    object = ET.SubElement(root, "object")
    name = ET.SubElement(object, "name")
    name.text = "apple"
    bndbox = ET.SubElement(object, "bndbox")
    xmin = ET.SubElement(bndbox, "xmin")
    xmin.text = str(start_x)
    ymin = ET.SubElement(bndbox, "ymin")
    ymin.text = str(start_y)
    xmax = ET.SubElement(bndbox, "xmax")
    xmax.text = str(end_x)
    ymax = ET.SubElement(bndbox, "ymax")
    ymax.text = str(end_y)

    # 写入 XML 文件
    tree = ET.ElementTree(root)
    tree.write("apple.xml")

# 添加保存按钮
save_button = Button(root, text="保存", command=save)
save_button.pack()

4. 总结

在这个攻略中，我们通过以下步骤实现了一个简单的图片物体标注工具：

确定需求
准备工作
编写代码

我们使用 Python 和一些第三方库来实现了两个示例，分别是标注狗和标注苹果。我们通过鼠标事件来标注图片，并使用 XML 文件保存了标注信息。这个工具只是一个简单的示例，但也有一定的实用性，可以帮助我们更方便地进行一些简单的物体标注任务。