R的行和列命名和类型的转换

下面内容摘录自：

4章8节：用R做数据重塑，行列命名和数据类型转换-CSDN博客

欢迎订阅我们专栏

一、行和列命名

在数据科学和统计分析中，命名是组织和管理数据的一个重要部分。尤其是在处理复杂的多维数据集时，为行和列命名有助于清晰地标识数据，并使得后续的分析过程更加直观和便捷。在R语言中，names()函数用于为向量或其他对象分配名称，而对于矩阵这类二维数据结构，则需分别使用rownames()和colnames()函数为其行和列进行命名。本文将详细探讨如何在R中对行和列进行命名，并讨论一些实际应用场景。

1、向量命名与`names()`函数

在R中，names()函数可以用于为向量的元素赋予名称。命名的长度必须与向量的长度相等，这样每个元素都有一个唯一的标识符。这对于后续数据的访问和管理非常有用。

x <- c(1, 2, 3)
names(x) <- c("ISH", "IDH", "SDH")
x

结果可见：

ISH IDH SDH 1   2   3

在上面的例子中，我们为向量x的三个元素分别命名为"ISH"、"IDH"和"SDH"。这使得我们在访问这些元素时可以通过名称进行访问，而不仅仅依赖于位置索引。

2、矩阵中的行和列命名

矩阵是一种常见的二维数据结构，类似于一张表格，其中行表示样本，列表示变量。在进行数据分析时，通常需要对矩阵的行和列进行命名，以便明确表示每一行和每一列的含义。R语言中提供了rownames()和colnames()函数来分别为矩阵的行和列进行命名。

矩阵的创建

首先，我们通过matrix()函数创建一个简单的3x3矩阵：

datamatrix <- matrix(c(1,2,3,4,5,6,7,8,9), nrow=3)
datamatrix

结果可见：

     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9

在这里，矩阵datamatrix由三行三列组成，默认情况下没有行列名称。

为矩阵行和列命名

接下来，我们使用rownames()函数和colnames()函数为矩阵的行和列命名：

rownames(datamatrix) <- c("r1", "r2", "r3")
colnames(datamatrix) <- c("c1", "c2", "c3")
datamatrix

结果可见：

   c1 c2 c3
r1  1  4  7
r2  2  5  8
r3  3  6  9

此时，我们为矩阵的每一行命名为r1、r2和r3，为每一列命名为c1、c2和c3。这样，在分析数据时，能够更直观地理解矩阵中的内容。例如，如果矩阵的行代表不同的患者，而列代表不同的检测指标，那么行列的命名就可以直接反映这些信息。

实际应用场景

在临床数据分析中，矩阵常用于表示患者的不同检测指标或时间点的数据。例如，一个典型的3x3矩阵可能表示三个患者在三个不同时间点的血糖值：

# 创建矩阵表示血糖值
blood_sugar <- matrix(c(90, 110, 100, 85, 120, 95, 88, 130, 105), nrow=3)
rownames(blood_sugar) <- c("Patient1", "Patient2", "Patient3")
colnames(blood_sugar) <- c("T1", "T2", "T3")
blood_sugar

结果可见：

          T1  T2  T3
Patient1  90  85  88
Patient2 110 120 130
Patient3 100  95 105

在这个例子中，Patient1、Patient2和Patient3分别代表三个不同的患者，T1、T2和T3代表三个不同的时间点。通过对行列命名，可以更容易地追踪和解释每个数据点。

二、类型的转换

在R语言中，数据类型是处理数据分析和操作的基础。在编写和运行R脚本时，时常需要进行数据类型的检查和转换，以确保正确的运算和数据处理。在这一部分，我们将深入探讨如何在R语言中进行数据类型的转换，包括如何利用as.*和is.*函数来实现不同向量类型之间的转换与检测。

1、R中的常见数据类型

数据类型	描述	举例
数值型（Numeric）	包括整数型和双精度型，通常用于数值计算。	`x <- 3.14`
字符型（Character）	用于存储字符串，即文本数据。	`name <- "Alice"`
逻辑型（Logical）	存储布尔值，TRUE或FALSE。	`flag <- TRUE`
因子型（Factor）	用于存储分类数据，常用于统计模型中。	`gender <- factor(c("male", "female"))`
整型（Integer）	专门用于存储整数值，通常需要明确指定类型。	`y <- as.integer(10)`
复数型（Complex）	用于存储复数。	`z <- 2 + 3i`

复数型（Complex）是R语言中的一种数据类型，用于存储复数。复数是数学中由实部和虚部组成的数，通常表示为 a+bia+bi 的形式，其中 aa 是实部，bb 是虚部，ii 是虚数单位，定义为 i2=−1i2=−1。

在R中，复数可以通过以下方式创建：

z <- 2 + 3i

在这个例子中，z 是一个复数，其中实部是 2，虚部是 3。复数型数据类型在R中可以用于进行复杂的数学计算，包括复数的加减乘除、求模、求角度等。

你可以使用函数 Re(z) 和 Im(z) 来分别提取复数的实部和虚部。例如：

Re(z) # 返回 2Im(z) # 返回 3

R还支持对复数进行基本运算和更复杂的数学操作，如取模 Mod(z) 和计算辐角 Arg(z)。1）取模 Mod(z)：计算复数 z=a+biz=a+bi 的模，表示为 ∣z∣=a2+b2∣z∣=a2+b2，即复数在复平面上到原点的距离。2）计算辐角 Arg(z)：计算复数 z=a+biz=a+bi 的辐角，表示为 θ=tan⁡−1(ba)θ=tan−1(ab)，即复数与实轴正方向之间的角度，通常以弧度表示。

2.、数据类型检查

在处理数据时，检查数据的类型是非常重要的一步。在R中，我们可以通过以下几种方式来检查数据类型：

class()：返回对象的类（即数据类型）。
str()：显示对象的内部结构，包括类型和内容。
is.*函数：检查对象是否属于某一类型，如is.numeric()、is.character()、is.logical()等。

例如，假设我们有一个字符向量datachar，我们可以通过class()函数检查其类型：

datachar <- c("1", "2", "3")
class(datachar)

结果可见：

[1] "character"

这个结果表明datachar是一个字符型向量。如果我们尝试对其进行数值运算，则会遇到错误

datachar + 10

结果可见：

Error in datachar + 10 : non-numeric argument to binary operator

这个错误提示表明，datachar中包含的元素不能直接用于数值计算。因此，必须先将字符型向量转换为数值型向量。

3、数据类型的转换

.........

欢迎订阅我们专栏，深度系统地学习R语言。

为帮助大家更出色地掌握临床统计、数据挖掘以及人工智能建模的入门知识和应用，由于众多同学在计算机编程上经验欠缺，特此开设《R 语言与数据科学的终极指南》专栏。该专栏每周至少会定期更新三篇，直到整个专栏更新完成。每篇文章都在 5000 字以上，质量平均分高达 94 分。要提醒大家的是，每结束一个章节，专栏的优惠力度就会减小，当下正是订阅的最佳优惠时段，诚邀各位积极订阅！

专栏《R 语言与数据科学的终极指南》链接：https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482