前戏
现代Linux有两种共享内存机制:
- POSIX共享内存(shm_open()、shm_unlink())
- System V共享内存(shmget()、shmat()、shmdt())
其中,System V共享内存历史悠久,一般的UNIX系统上都有这套机制;而POSIX共享内存机制接口更加方便易用,一般是结合内存映射mmap使用。
mmap和System V共享内存的主要区别在于:
- sysv shm是持久化的,除非被一个进程明确的删除,否则它始终存在于内存里,直到系统关机;
- mmap映射的内存在不是持久化的,如果进程关闭,映射随即失效,除非事先已经映射到了一个文件上。
内存映射机制mmap是POSIX标准的系统调用,有匿名映射和文件映射两种。
- 匿名映射使用进程的虚拟内存空间,它和malloc(3)类似,实际上有些malloc实现会使用mmap匿名映射分配内存,不过匿名映射不是POSIX标准中规定的。
- 文件映射有MAP_PRIVATE和MAP_SHARED两种。前者使用COW的方式,把文件映射到当前的进程空间,修改操作不会改动源文件。后者直接把文件映射到当前的进程空间,所有的修改会直接反应到文件的page cache,然后由内核自动同步到映射文件上。
相比于IO函数调用,基于文件的mmap的一大优点是把文件映射到进程的地址空间,避免了数据从用户缓冲区到内核page cache缓冲区的复制过程;当然还有一个优点就是不需要频繁的read/write系统调用。
由于接口易用,且可以方便的persist到文件,避免主机shutdown丢失数据的情况,所以在现代操作系统上一般偏向于使用mmap而不是传统的System V的共享内存机制。
建议仅把mmap用于需要大量内存数据操作的场景,而不用于IPC。因为IPC总是在多个进程之间通信,而通信则涉及到同步问题,如果自己手工在mmap之上实现同步,容易滋生bug。推荐使用socket之类的机制做IPC,基于socket的通信机制相对健全很多,有很多成熟的机制和模式,比如epoll, reactor等。
sysv shm的实现可以参考glibc源码,shm_open(3) 打开一个名为abc的共享内存,等价于open("/dev/shm/abc", ..),其中 /dev/shm 是Linux下sysv共享内存的默认挂载点。shm_open调用返回一个文件描述符,其实也可以给 mmap(2) 使用,作为named share memory使用。
sysv shm代码实例:
思考:
- 如果使用 MAP_SHARED 的文件映射方式,由于内核自动同步page cache到文件,如果进程意外crash,是否可能出现内存数据没有及时同步到文件的情况。
- 同样的情况,如果没有主动调用shm_unlink,那么文件在内存中的映射是否自动消失?因为原来就是映射到进程空间的,但这个进程已经死了。还是说内核自动维护page cache,与具体的进程无关。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。