learn-data-structures/2.1 单链表
austin 87829d3178 linked list 2021-11-17 11:12:48 +08:00
..
README.md linked list 2021-11-17 11:12:48 +08:00
linked_list.c linked list 2021-11-17 11:12:48 +08:00

README.md

本节的重要性

这里我要多啰嗦几句因为单链表是非常基础的链式结构所以当你学会了用C语言描述单链表的时后面的堆、栈、双向链表、哈希表等用C描述将不在话下。
如果你是一名初学者,那更应该仔细阅读本篇,强烈建议自己敲一遍代码。

单链表的节点

linked_list_node.png 如图所示,单链表的节点分为数据域和指针域,可以将它们视为一个整体,称之为节点,稍后我们会用结构体来表示节点。
数据域,顾名思义,就是存放数据的地方。
指针域,是用来存放指针变量的地方,指针指向下一个节点的地址。

单链表的表示

单链表是线性表的链式表示和实现。把节点链接起来,就形成了单链表。
linked_list1.png

定义表示节点的结构体

如何用C语言描述节点这里我们用到了struct

struct node {
    /* 后继节点 */
    struct node *next;
    /* 值 */
    int data;
};

首先我们定义了一个结构体,结构体的标记为node
其次,它具有两个属性,一个是int类型的data,也就是上文提到的数据域。还一个是指针域。 如何理解struct node *next呢?
要知道,指针域是存放指针变量的,这个变量名叫做 next,又因为这个指针是指向下一个节点的地址的,换句话说,这个指针指向的是一个我们定义的用来表示节点的结构体。所以这个指针变量的类型为 struct node。星号*表示它是指针变量。所以合起来就是struct node *next。 最后,为了方便,我们可以使用typedef关键字为struct node取一个别名。

typedef struct node {
    /* 后继节点 */
    struct node *next;
    /* 值 */
    int data;
}list;

这样,在后面的代码书写中, list就等价于struct node了。 比如我们使用这个结构体创建一个新的节点, list *new_node就等价于struct node *new_node

单链表的创建

list * create_list()
{
    /* 创建一个新的节点由于使用了typedef关键字此处 node *head与struct node *head等价    */
    list *head = (list *)malloc(sizeof(list));
    if(head==NULL) return NULL;
    /* 初始化节点 */
    head->data = 0; // 头结点数据域,我们用来表示链表长度
    head->next = NULL; 
    return head;
}

linked_list_head.png

此函数会创建一个单链表,并返回头指针。 头指针是指向头结点地址的指针,和节点中指向下一个节点的指针是相同类型。
首先,我们用malloc函数开辟了一块list大小的内存,并返回了指向该内存块首地址的指针,同时将此指针赋值给头指针变量。
接着,判断此指针是否为空,为空,则说明内存申请失败(一般不会)。
然后,对该节点进行初始化。
最后,函数返回头指针,结束。

为什么设置头节点?
头节点的数据域一般无意义,这里为了方便后面的插入和删除操作而设置,头节点并非链表所必须。
头节点后面的第一个元素节点,称为首元节点。

单链表的插入

试想如下情况,一个新的节点n,要插入到x节点后。 linked_list_insert.png 图中虚线表示断开连接,下同。
按照一般思路可能是:

x->next = n;
n->next = x->next;

显然,这是错误的,因为执行x->next = n之后,n->next = x->next等价于n->next = n ,所以正确的做法应该是这样;

n->next = x->next;
x->next = n;

完整版插入函数: 插入函数接受三个参数,被插入节点的链表的指针head,新结点的数据data,和要插入的位置pos;

list * list_insert_node(list *head, int data, int pos)
{   
    int i;
    list *current = head;

    /* 如果要插入的位置比链表长,则属于非法操作 */
    if(pos > current->data) return NULL;

    /* 创建一个节点,并初始化 */
    list *node = (list *)malloc(sizeof(list));
    if(node==NULL) return NULL;
    node->data = data;
    node->next = NULL;

    /* 遍历链表,找到要插入的位置 */
    for(i=0;i<pos;i++){
        current = current->next;
    }

    /* 插入 */
    node->next = current->next;
    current->next = node;

    /* 链表长度+1 */
    head->data++;
    return head;
}

可以在main函数中调用测试

list *l = create_list();
printf("当前链表长度:%d\n", l->data);
list_insert_node(l, 1, 0);
printf("当前链表长度:%d\n", l->data);

使用gcc编译:

gcc -fsanitize=address -fno-omit-frame-pointer  -g linked_list.c  && ./a.out

输出正常且无内存报错信息:

当前链表长度0
当前链表长度1

单链表的遍历

较为简单,不再解释

/* 打印链表数据,但不包括头结点的数据*/
void print_list(list *head)
{
    list *current = head->next;
    while (current)
    {
        printf("%d \t", current->data);
        current = current->next;
    }
    printf("\n");
}

单链表的删除

linked_list_delete.png 假设要删除head后的节点那么直接让head->next = head->next->next即可,但不要忘记释放被删除的节点。 基于此思路:

list *list_delete_data(list *head, int pos)
{
    int i;
    list *current = head;

    /* 如果要删除的位置比链表长,则属于非法操作 */
    if(pos > current->data) return NULL;

    /* 遍历链表,找到要删除的节点的前一个节点的指针 */
    for(i=0;i<pos;i++){
        current = current->next;
    }
    // 临时记录将被删除的节点
    list *temp = current->next;
    // 删除节点
    current->next = current->next->next;
    
    //释放掉被删除节点的内存
    free(temp);
    head->data--;
    return head;
}

单链表的测试

这样,一个基础的链表就写好了,可以在main函数中测试。

int main()
{
    int i;
    list *l = create_list();
    // 多次插入数据
    for(i=0;i<5;i++){
        list_insert_node(l, i, 0);
        print_list(l);
    }
    list_delete_data(l, 0);
    print_list(l);
    return 0;
}

编译与输出:

# gcc -fsanitize=address -fno-omit-frame-pointer  -g linked_list.c  && ./a.out
0 
1       0 
2       1       0 
3       2       1       0 
4       3       2       1       0 
3       2       1       0 

完整代码

完整代码,详见代码清单。