Skip to content

YIN-jw/scratch3_bodypix_install

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 

Repository files navigation

scratch3_bodypix_install

在Scratch3.0上安装bodypix插件

一、Scratch3.0 GUI搭建插件

可参考scratch3.0_posenet_install中的过程,发散思维,任何一个插件在GUI上的搭建过程均为这样。
1.1、在scratch-vm\src\extensions下新建scratch3_bodypix文件夹,放入写好的index.js。
1.2、修改extensions-manager.js,如下:

const dispatch = require('../dispatch/central-dispatch');
const log = require('../util/log');
const maybeFormatMessage = require('../util/maybe-format-message');
const BlockType = require('./block-type');
const Scratch3KnnBlocks = require('../extensions/scratch3_knn');
const Scratch3FaceapiBlocks = require('../extensions/scratch3_faceapi');
+const Scratch3BodypixBlocks = require('../extensions/scratch3_bodypix');
// These extensions are currently built into the VM repository but should not be loaded at startup.
// TODO: move these out into a separate repository?
// TODO: change extension spec so that library info, including extension ID, can be collected through static methods

const builtinExtensions = {
    // This is an example that isn't loaded with the other core blocks,
    // but serves as a reference for loading core blocks as extensions.
    coreExample: () => require('../blocks/scratch3_core_example'),
    // These are the non-core built-in extensions.
    pen: () => require('../extensions/scratch3_pen'),
    wedo2: () => require('../extensions/scratch3_wedo2'),
    music: () => require('../extensions/scratch3_music'),
    microbit: () => require('../extensions/scratch3_microbit'),
    text2speech: () => require('../extensions/scratch3_text2speech'),
    translate: () => require('../extensions/scratch3_translate'),
    videoSensing: () => require('../extensions/scratch3_video_sensing'),
    ev3: () => require('../extensions/scratch3_ev3'),
    makeymakey: () => require('../extensions/scratch3_makeymakey'),
    boost: () => require('../extensions/scratch3_boost'),
    gdxfor: () => require('../extensions/scratch3_gdx_for'),
    knnAlgorithm:() =>require('../extensions/scratch3_knn'),
    faceapi:()=>require('../extensions/scratch3_faceapi'),
   +bodypix:()=>require('../extensions/scratch3_bodypix')
};
......

1.3、 在scratch-gui\src\lib\libraries\extensions路径下新建文件夹bodypix。在其中放入bodypix.png和bodypix-small.svg。
1.4、 设置index.jsx 文件,该文件位于scratch-gui\src\lib\libraries\extensions路径下。修改方式如下,+所指部部分为添加的代码: 首先调用刚才放置好的.svg和.png图片作为模块的封面:

......
import makeymakeyIconURL from './makeymakey/makeymakey.png';
import makeymakeyInsetIconURL from './makeymakey/makeymakey-small.svg';

import knnalgorithmImage from './knnAlgorithm/knnAlgorithm.png';
import knnalgorithmInsetImage from './knnAlgorithm/knnAlgorithm-small.svg';

+import bodypixImage from './bodypix/bodypix.png';
+import bodypixInsetImage from './bodypix/bodypix-small.svg';

import microbitIconURL from './microbit/microbit.png';
import microbitInsetIconURL from './microbit/microbit-small.svg';
import microbitConnectionIconURL from './microbit/microbit-illustration.svg';
import microbitConnectionSmallIconURL from './microbit/microbit-small.svg';
......

之后设置bodypix extension的封面:

export default [
......
},
+{
+       name: (
+           <FormattedMessage
+               defaultMessage="bodypix"
+               description="Name for the 'bodypix' extension"
+               id="gui.extension.bodypix.name"
+           />
+       ),
+       extensionId: 'bodypix',
+       iconURL: bodypixImage,
+       insetIconURL: bodypixInsetImage,
+       description: (
+           <FormattedMessage
+               defaultMessage="bodypix."
+               description="Description for the 'bodypix' extension"
+               id="gui.extension.bodypix.description"
+           />
+       ),
+       featured: true
+   },
......

注意extensionId部分的内容和步骤2中第一个代码框中冒号前内容相同,这是bodypix extension的id 属性,因此必须相同,之后index.js的编写中也会有相应部分的提示。 1.5、进行测试。此时在/scratch-gui/ 中运行webpack-dev-server –https,之后新建console dialog 在/scratch-vm/ 中运行yarn run watch,再新建console dialog 在/scratch-gui/ 中运行yarn link scratch-vm。后所得的网页,在https://127.0.0.1:8601/ 端口可以看到bodypix的封面已经完成,但此时点击不会有内容,我们此时需要对index.js的内容进行编辑。

二、bodypix模型的加载

2.1、环境配置
使用的是:@tensorflow-models/[email protected];peerDependencies:"@tensorflow/tfjs-converter": "^1.3.1","@tensorflow/tfjs-core": "^1.3.1"
当使用npm或者是yarn后,模型依赖的版本可以在package.json文件中进行查看。
2.2、导入Tensorflow.js库
在index的开头加入:

require('babel-polyfill');
const Runtime = require('../../engine/runtime');

const ArgumentType = require('../../extension-support/argument-type');
const BlockType = require('../../extension-support/block-type');
const Clone = require('../../util/clone');
const Cast = require('../../util/cast');
const Video = require('../../io/video');
const formatMessage = require('format-message');
//
//import * as bodyPix from '@tensorflow-models/body-pix';
const bodyPix = require('@tensorflow-models/body-pix');
const tf = require('@tensorflow/tfjs-core');
//const tf = require('@tensorflow/tfjs');
const canvas = require('canvas')
......

然后保存后根据console的报错安装依赖即可,这里直接yarn add @tensorflow/tfjs-core,安装的为1.7.2版本,bodypix和posenet均可使用。

三、加载网络

参考官方给的事例:https://github.com/tensorflow/tfjs-models/tree/master/body-pix
可以加载的网络有两个,mobilenet和resnet,在此选用mobilenet进行加载。由于加载网络耗时久,采用异步加载的方法:

    async bodyPixInit () {
		//
        this.bodyPix = await bodyPix.load({//加载模型,还可以选用'ResNet50'
        architecture: 'MobileNetV1',
        outputStride: 16,
        multiplier: 0.75,
        quantBytes: 2
        });
		console.log(this.bodyPix)
    }

可以通过控制台看到模型的相关信息,给出的是一个数列,与posenet类似,很好理解。

四、做出预测(各API的使用)

4.1、Person segmentation
该API输入为一个或多个人的图像,person segmentation可做出对所有人体(此处不用区分单人或多人)的分割。它返回PersonSegmentation对应于图像中人物分割的对象。它不会在不同的个人之间消除歧义(即不会将多人中每个人区分开)。如果您需要将个人细分,请使用segmentMultiPerson(警告是此方法比较慢)。

......
        setInterval(async () => {
				const imageElement = this.video;
				this.video.width = 640;
				this.video.height = 480;
				const flipHorizontal = false;
				const internalResolution = 'medium';
				const segmentationThreshold = 0.7;
				const maxDetections = 5;
				const scoreThreshold = 0.3;
				const nmsRadius = 20;
				const net = this.bodyPix;
                const personsegmentation = await net.segmentPerson(imageElement,{flipHorizontal,internalResolution,segmentationThreshold,maxDetections,scoreThreshold,nmsRadius}); 
                console.log(personsegmentation)
            },5000);
......

返回personsegmentation,包括画布中每个像素的值,背景为0,人物为1,并且包括每个人的pose内容。图像中的多个人合并为一个二进制图像,相当于输出的是一个单个数组。
4.2、Person body part segmentation
输入为一个或多个人的图像,BodyPix的segmentPersonParts方法可以对图像中所有人的24个身体部位进行分割。PartSegmentation对于所有人体,它为每个像素返回对应于身体部位的对象。如果您需要将个人细分,请使用segmentMultiPersonParts(警告是此方法比较慢)。

......
        this.timer = setInterval(async () => {
				const imageElement = this.video;
				this.video.width = 640;
				this.video.height = 480;
				const flipHorizontal = false;
				const internalResolution = 'medium';
				const segmentationThreshold = 0.7;
				const maxDetections = 5;
				const scoreThreshold = 0.3;
				const nmsRadius = 20;
				//
				const net = this.bodyPix;
                const personbodypartsegmentation = await net.segmentPersonParts(imageElement,{flipHorizontal,internalResolution,segmentationThreshold,maxDetections,scoreThreshold,nmsRadius});
                console.log(personbodypartsegmentation)
            }, 5000);
......

返回该personbodypartsegmentation对象包含一个宽度,高度,Pose和一个Int32Array,其ID为对应的身体部位的一部分,其ID为0-24,否则为-1。即像素点为-1表示非人员部分,为0表示为人体的左脸。当图像中有多个人时,他们将合并为单个数组。
4.3、Multi-person segmentation
给定一个包含多人的图像,多人分割模型可以分别预测每个人的分割(能将多人中每个人再区分开)。它返回一个数组,PersonSegmentation每个数组对应一个人。每个元素都是一个人的二进制数组,其中一个人的像素为1,否则为0。阵列大小对应于图像中的像素数。如果您不需要将个人细分,则使用segmentPerson速度更快且不会细分个人。

......
            this.timer = setInterval(async () => {
				const imageElement = this.video;
				this.video.width = 640;
				this.video.height = 480;
				const flipHorizontal = false;
				const internalResolution = 'medium';
				const segmentationThreshold = 0.7;
				const maxDetections = 5;
				const scoreThreshold = 0.2;
				const nmsRadius = 20;
				const minKeypointScore = 0.3;
				const refineSteps = 10;
				//
				const net = this.bodyPix;
                const multipersonsegmentation = await net.segmentPersonParts(imageElement,{flipHorizontal,internalResolution,segmentationThreshold,maxDetections,scoreThreshold,nmsRadius,minKeypointScore,refineSteps}); 
            }, 5000);
......

返回一个数组multipersonsegmentation,当图像中有多个人时,multipersonsegmentataion数组中的每个对象代表一个人。除了width,height和data,PersonSegmentation对象也有一个字段pose,与posenet插件类似。data对象包括每个像素的值,为1表示人像,为0表示背景,-1为非人像背景。
与segmentPerson的区别:segmentPerson不能区分每个人像。
4.4、Multi-person body part segmentation
给定具有多个人的图像。BodyPix的segmentMultiPersonParts方法可以预测每个人的24个身体部位细分。它返回一个数组的PartSegmentations,各自对应的人之一。该PartSegmentation对象包含一个宽度,高度Pose和一个Int32Array,其ID为对应的身体部位的一部分,其ID为0-24,否则为-1。

......
            this.timer = setInterval(async () => {
				const imageElement = this.video;
				this.video.width = 640;
				this.video.height = 480;
				const flipHorizontal = false;
				const internalResolution = 'medium';
				const segmentationThreshold = 0.7;
				const maxDetections = 5;
				const scoreThreshold = 0.2;
				const nmsRadius = 20;
				const minKeypointScore = 0.3;
				const refineSteps = 10;
				//
				const net = this.bodyPix;
                const multipersonbodypartsegmentation = await net.segmentMultiPersonParts(imageElement,{flipHorizontal,internalResolution,segmentationThreshold,maxDetections,scoreThreshold,nmsRadius,minKeypointScore,refineSteps}); 
                console.log(multipersonbodypartsegmentation)
            }, 5000);
......

返回数组multipersonbodypartsegmentation,当图像中有多个人时,数组中的每个对象代表一个人。除了width,height和data,multipersonbodypartsegmentation对象也有一个字段pose,它包含每个人的姿势与PoseNet模型相同,但准确性较差。data对象中包括每个像素的值,当为-1时代表非人像背景,为0时代表左脸。(0——23)
综上调用各个函数可以实现不同的功能,但输出的仍是数组的形式,再调用body-pix相应的绘图函数即可在画布上完成相应的功能。

五、Bodypix可视化功能

5.1、bodyPix.toMask
给定人员分割(或多人分割)的输出,生成每个像素的可视化效果,该可视化由输出中像素处的相应二进制分割值确定。换句话说,有人的像素将由前景色着色,而没有人的像素将由背景色着色。可以用作合成时遮盖人物或背景的遮罩。

......
			this.timer = setInterval(async () => {
			    const imageElement = this.video;
			    this.video.width = 640;
			    this.video.height = 480;
			    const flipHorizontal = false;
			    const internalResolution = 'medium';
			    const segmentationThreshold = 0.7;
			    const maxDetections = 5;
			    const scoreThreshold = 0.3;
			    const nmsRadius = 20;
			    const net = this.bodyPix;
			    const segmentation = await net.segmentPerson(imageElement,{flipHorizontal,internalResolution,segmentationThreshold,maxDetections,scoreThreshold,nmsRadius});
			    const foregroundColor = {r: 255, g: 255, b: 255, a: 255};
			    const backgroundColor = {r: 0, g: 0, b: 0, a: 255};
			    const coloredPartImage = bodyPix.toMask(segmentation, foregroundColor, backgroundColor,true);
			    const opacity = 0.7;
			    const maskBlurAmount = 0;
			    bodyPix.drawMask(canvas,imageElement,coloredPartImage, opacity, maskBlurAmount,flipHorizontal);

            }, 1000);
......

返回具有personSegmentation宽度和高度相同的ImageData,每个像素的颜色和不透明度由来自输出的像素处的相应二进制分割值确定。如果设置foregroundColor为{r:0,g:0,b:0,a:255}且设置backgroundColor为{r:0,g: 0,b:0,a:0},该方法可用于遮盖背景。
5.2、bodyPix.toColoredPartMask
给定人体部位分割(或多人人体部位分割)的输出以及由部件ID索引的颜色数组,将生成一个图像,该图像在每个像素处具有对应于每个部位的相应颜色,而在白色像素中则没有部位。

......
bodyPix.drawMask(canvas,imageElement,coloredPartImage, opacity, maskBlurAmount,flipHorizontal);
......

返回具有与估计的人的部分分割相同的宽度和高度的ImageData,在每个像素处每个部分具有对应的颜色,而在没有像素的地方则具有黑色像素。
5.3、bodyPix.drawMask
在画布上绘制图像,并用ImageData在其顶部绘制一个具有指定不透明度的遮罩;ImageData的使用通常产生toMask或toColoredPartMask。

......
bodyPix.drawMask(canvas,imageElement,backgroundDarkeningMask, opacity, maskBlurAmount,flipHorizontal);
......

返回绘制一个具有指定不透明度的遮罩。
5.4、bodyPix.drawPixelatedMask
在画布上绘制图像,并ImageData在其顶部绘制一个具有指定不透明度的遮罩;的ImageData使用通常产生toColoredPartMask。不同于drawMask,此渲染功能将像素化效果应用于BodyPix的身体部位分割预测。这允许用户显示低分辨率的身体部位分割,从而提供了身体部位分割预测的美学解释。

......
bodyPix.drawPixelatedMask(canvas,imageElement,coloredPartImage, opacity, maskBlurAmount,flipHorizontal,pixelCellWidth);
......

返回渲染功能将像素化效果应用于BodyPix的身体部位分割,这允许用户显示低分辨率的身体部位分割,从而提供了身体部位分割预测的美学解释。
5.5、bodyPix.drawBokehEffect
给定一个personSegmentation和一个图像,将背景模糊的图像绘制到画布上。

......
bodyPix.drawBokehEffect(canvas,imageElement,segmentation, backgroundBlurAmount,edgeBlurAmount,flipHorizontal);
......

返回一个背景模糊图像。原理:一个倒置的掩模被从personSegmentation生成,然后将原始图像绘制到画布上,并使用画布合成操作destination-over将蒙版绘制到画布上,从而删除背景。使用合成操作将原始图像模糊并绘制到与现有图像不重叠的画布上。结果显示在最右边的图像中。
5.6、bodyPix.blurBodyPart
给定一个PartSegmentation(或PartSegmentation的数组)和一个图像,会使某些人的身体部位(例如左脸和右脸)模糊。

......
bodyPix.blurBodyPart(canvas,imageElement,partSegmentation, faceBodyPartIdsToBlur,backgroundBlurAmount,edgeBlurAmount,flipHorizontal);
......

返回一个将左脸和右脸模糊的图像,可通过faceBodyPartIdsToBlur进行指定模糊的对象。
综上:使用body-pix自带的几种绘图函数可实现不同的效果。同时可参考posenet模型将人像的骨架绘制出来(使用pose对象即可)。

六、其他

参考 https://github.com/tensorflow/tfjs-models/tree/master/body-pix#bodypix---person-segmentation-in-the-browser 中的说明,API中的参数imageElement也可以为除了canvas以外的很多类型,发散思维,可以添加本地图片进行分割,彩色,黑白或者模糊处理。

About

在Scratch3.0上安装bodypix插件

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published