科学研究的目的就是研究事物的特征,并根据共同的特征加以分类
商品分类是商业,制造业中最普遍的活动,几乎所有的企业,电商平台都要对销售的商品,使用的原材料(BOM)进行分类和编号。
商品分类貌似没有多少技术含量,它是数字化转型的重要基石。一个不合理的分类方法会导致混乱和难以使用。
现有商品分类系统遇到的问题
各种标准化组织和机构提出了分类系统,它们包括:
- UNSPSC
- GS1
- ETIM
- ECL@SS
- IEC 61360
它们有的是公开免费的,有的是收费服务的。分类方式也各不相同。使用这些分类标准面临各种挑战。
我们以gs1为例,讨论现有商品分类中遇到的问题。
GS1全球商品分类标准(Global Product Classification, GPC)不断扩展更新,每年发布两个新版本。GPC分类代码按照大类(Segment)、中类(Family)、小类(Class)、细类(Brick)来划分,并细分为具体的商品核心属性类型和属性值。商品数据交换中,通常采用第4级代码,即细类代码。
但是这种4级分类仍然不够细。进一步细分只能依靠属性(attributes)来分类了。例如服装的分类如下
Segment 67000000服装
Segment67000000 服装Family67040000内衣Family67010000服装Class67010800上半身服装或上衣Brick10001361上半身服装、上衣组合装Brick10001350夹克、外套、羊毛衫、马甲Brick10001351毛衣、套头毛衣Brick10001352长袖衬衫、女式衬衫、马球衫、T恤
显然这样的分类不够的,需要进一步细分 ,比如男女,风格,材料等。
属性与特征区别
在讨论信息模型时,经常提到属性(attribute)和特征(Property),有的地方使用attribute ,有的地方使用特征(Property) ,那么属性和特征到底有什么区别呢?
我们知道,模型是事物的简单描述。模型描述了事物的特征(Property)以及与其它事物的关系(Relationship)。
从分类的视角看,事物是通过某些主要特征来分类的,主要特征相同的商品被分为一类。这主要特征称为属性(attribute),我们能够体会属性与特征的不同,用于分类的特征是属性。
在某些分类系统中,属性是类别中默认的。而商品的描述中包含了某些特征(Property),而在一些分类系统中不仅规定了类别,又定义了属性
例如服装的性别,gs1 提供了属性和属性值
例如:毛衣的属性及性别的属性值
Brick10001351毛衣、套头毛衣Attribute20000045消费者年龄段Attribute20001131性别Attribute Value30004039男性(雄性)Attribute Value30003891女性(雌性)Attribute Value30002518尚未确定的Attribute Value30002515未分类的Attribute Value30004340中性的Attribute20003164是否带帽Attribute20001141是否保暖Attribute20001941服装袖长Attribute20000794材料类型Attribute20001942毛衣、套头毛衣类型
笔者主张在产品分类系统中只有类别,不包含属性。而在商品描述中包含特征(Property)。这样更加清晰一点。
分类系统的挑战
常见的分类系统有下列几种:
GS1 | ETIM | ECL@SS | UNSPSC |
SEGMENT | Group | Segments | Segment |
FAMILY | Class | Main Groups | Family |
CLASS | Groups | Class | |
BRICK | Commodity classes | Commodity | |
Business Function |
但是它们之间的分类方式是不同的。
比如:医疗设备。 在GS1 中是一个Brick,而在ECL@SS 中是一个Segment,这就意味着在ECL@ 中,医疗设备分的更细 。
相比ECL@SS 而言,gs1 的分类过于宽泛。
分类系统的颗粒度
到底分类到多细才合适呢?这也许没有明确的答案,侧重点不同,分类的颗粒度也不同,在笔者看来,分类系统的颗粒度与产品属性的颗粒度有关。最底层的项目,应该具有相同的属性。
某种意义上讲,属性也是一种分类。可以将分类变成属性例如:性别。你可以将服装分类为男性服装,女性服装,儿童服装,成人服装和老年服装。当然你也可以在服装中,定义:适应性别,适应年龄段属性。
我们的研究更倾向在gs1 的基础上进一步细分,将gs1与ecl@ss 结合起来。构建6 级分类系统
- Segnment
- Family
- Brick
- Main Group
- Group
- Commodity
这样的安排的好处
- 商品分类的颗粒度更细,符合商业分类的习惯
- 有利于引用ECL@SS 的属性
- 有利于gs1和ECL@SS 的映射和转换
- 采用12位分类编码,能够细分更多的商品,前三层对应gs1编码,后三层对应ECL@SS 的MainGroup,Group和Commodity
商品的特征
商品的模型是由商品的特征(Property)组成的。分类系统与商品特征结合在一起,形成了如下分层结构。
- Segnment
- Family
- Brick
- Main Group
- Group
- Commodity
- Property
- Property
- Property
- Property
- Property
这种方式在gs1 的BRICK 基础上进一步细分,商品特征描述提供了商品信息模型。
分类系统与产品信息管理系统的关系
分类系统的主要用途是商品的信息管理(PIM),确切地讲,分类系统是产品的模型,而商品是产品模型的实例及其组合。需要将分类系统和PIM 系统区分开来,分类数据库中每一项对应一个商品类型,而产品数据库中的每一项是一个产品的SKU(库存量单位)。SKU 包含了无包装单元,单品,包装和托盘。无包装单元对应GS1 中的一个类。而单品,包装箱和托盘包含了SKU 的其它一些信息。比如SKU 的名称,图片,重量,价格等等。
商品的基本属性与SKU 的属性是不同的,如果将所有的SKU 信息包含到分类系统中,会引起混乱。将它们分开视乎更合理。
分类系统的项目是无包装单元的属性
BMEcat
BMEcat 是一个目录交换标准,创建于 1999 年,由德国 BME - Bundesverband Materialwirtschaft, Einkauf und Logistik e. V.. 协会开发。该标准基于 XML,完全开放且不收取任何费用,其最新版本是 BMEcat 2005。
供应链中的所有合作伙伴(制造商、批发商、供应商)都在交换越来越多的数据,而不同的数据格式使流程复杂化。通过使用 BMEcat 标准化信息系统之间的通信,大大降低了所有参与公司的成本。
PIM的数据模型
- 产品模型
- 机构模型
- 测量单位
产品模型
{"ID":"产品ID""Name":"商品名称","Type":["无包装单元","单品","包装箱","托盘"],"Items":[{"Code":"单元的编码","Type":"单元类型","Number":1}] "Supply":{"Name":"供应商名称","Id":"供应商ID",}"Brand":"品牌","Measurement":{"Length":"长度","Width”:"宽度","Height":"高度"},"Images":[{}]"Documents":[{}]
"Price":"价格"}
结论
分类系统是数字化转型的重要基石。同时它也是十分费时的辛苦工作。也许chatGPT AI 工具能够提升构建分类系统的效率。本文提出了目前几种分类系统存在的问题,并且提出了自己的看法。下一步我们将问题进一步的细化。从中发现更多的问题和解决方法。