1. 程式人生 > >NFS服務的簡介及常見故障解決方法

NFS服務的簡介及常見故障解決方法

NFS文件系統介紹 NFS配置詳解 NFS常見故障及解決方法 NFS文件系統詳解 NFS實現自動掛載

NFS服務的簡介及常見故障解決方法

1NFS基本介紹

1NFS簡介

NFS 是Network File System的縮寫,即網絡文件系統。一種使用於分散式文件系統的協定,由Sun公司開發,於1984年向外公布。功能是讓客戶端通過網絡訪問不同主機上磁盤裏的數據,主要用在類Unix系統上實現文件共享的一種方法。NFS在文件傳送或信息傳送過程中依賴於RPC協議。


技術分享圖片

2NFS服務需要安裝的軟件

nfs-utils-* :包括基本的NFS命令與監控程序

rpcbind-* :支持安全NFS RPC服務的連接

註:通常情況下,是作為系統的默認包安裝的

CentOS6.*之前rpcbind叫portmap。

3NFS系統守護進程

nfsd:它是基本的NFS守護進程,主要功能是管理客戶端是否能夠登錄服務器

mountd:它是RPC安裝守護進程,主要功能是管理NFS的文件系統。當客戶端順利通過nfsd登錄NFS服務器後,在使用NFS服務所提供的文件前,還必須通過文件使用權限的驗證。它會讀取NFS的配置文件/etc/exports來對比客戶端權限。

rpcbind:主要功能是進行端口映射工作。當客戶端嘗試連接並使用RPC服務器提供的服務(如NFS服務)時,rpcbind會將所管理的與服務對應的端口提供給客戶端,從而使客戶可以通過該端口向服務器請求服務。

4NFS的常用目錄

/etc/exports

NFS服務的主要配置文件

/usr/sbin/exportfs NFS服務的管理命令

/usr/sbin/showmount 客戶端的查看命令

/var/lib/nfs/etab 記錄NFS分享出來的目錄的完整權限設定值

/var/lib/nfs/xtab 記錄曾經登錄過的客戶端信息

NFS服務的配置文件為 /etc/exports,這個文件是NFS的主要配置文件,不過系統並沒有默認值,所以這個文件不一定會存在,可能要使用vim手動建立,然後在文件裏面寫入配置內容。

5/etc/exports文件內容格式

<輸出目錄> [客戶端

1 選項(訪問權限,用戶映射,其他)] [客戶端2 選項(訪問權限,用戶映射,其他)]

a. 輸出目錄:輸出目錄是指NFS系統中需要共享給客戶機使用的目錄

b. 客戶端:客戶端是指網絡中可以訪問這個NFS輸出目錄的計算機

客戶端常用的指定方式:

指定ip地址的主機:192.168.0.200

指定子網中的所有主機:192.168.0.0/24 192.168.0.0/255.255.255.0

指定域名的主機:david.bsmart.cn

指定域中的所有主機:*.bsmart.cn

所有主機:*

c. 選項:選項用來設置輸出目錄的訪問權限、用戶映射等。

NFS主要有3類選項:

訪問權限選項:

設置輸出目錄只讀:ro

設置輸出目錄讀寫:rw

用戶映射選項:

all_squash:將遠程訪問的所有普通用戶及所屬組都映射為匿名用戶或用戶組(nfsnobody);

no_all_squash:與all_squash取反(默認設置);

root_squash:將root用戶及所屬組都映射為匿名用戶或用戶組(默認設置);

no_root_squash:與rootsquash取反;

anonuid=xxx:將遠程訪問的所有用戶都映射為匿名用戶,並指定該用戶為本地用戶(UID=xxx);

anongid=xxx:將遠程訪問的所有用戶組都映射為匿名用戶組賬戶,並指定該匿名用戶組賬戶為本地用戶組賬戶(GID=xxx);

其它選項

secure:限制客戶端只能從小於1024tcp/ip端口連接nfs服務器(默認設置);

insecure:允許客戶端從大於1024tcp/ip端口連接服務器;

sync:將數據同步寫入內存緩沖區與磁盤中,效率低,但可以保證數據的一致性;

async:將數據先保存在內存緩沖區中,必要時才寫入磁盤;

wdelay:檢查是否有相關的寫操作,如果有則將這些寫操作一起執行,這樣可以提高效率(默認設置);

no_wdelay:若有寫操作則立即執行,應與sync配合使用;

subtree:若輸出目錄是一個子目錄,則nfs服務器將檢查其父目錄的權限(默認設置)

no_subtree:即使輸出目錄是一個子目錄,nfs服務器也不檢查其父目錄的權限,這樣可以提高效率;

2、配置NFS服務端

1)關閉系統防火墻和selinux

[root@localhost ~]# systemctl stop firewalld 關閉防火墻

[root@localhost ~]# systemctl status firewalld 查看防火墻狀態

firewalld.service - firewalld - dynamic firewall daemon

Loaded: loaded (/usr/lib/systemd/system/firewalld.service; disabled; vendor preset: enabled)

Active: inactive (dead)

Docs: man:firewalld(1)

[root@localhost ~]# sed -i "7s/enforcing/disabled/" /etc/selinux/config

[root@localhost ~]# setenforce 0

2)安裝需要的軟件

[root@localhost ~]# yum -y install rpc-bind nfs-utils

3)修改/etc/exports文件,定義NFS共享

NFS服務器的/zhangsan共享給192.168.115.0/24網段,rw權限

[root@localhost ~]# vim /etc/exports

/zhangsan 192.168.115.0/24(rw)

4)創建/zhangsan這個共享目錄並設置權限

[root@localhost ~]# mkdir /zhangsan

[root@localhost ~]# chmod 777 /zhangsan

5)啟動NFS服務並設置為開機自啟動

[root@localhost ~]# systemctl enable nfs

Created symlink from /etc/systemd/system/multi-user.target.wants/nfs-server.service to /usr/lib/systemd/system/nfs-server.service.

[root@localhost ~]# systemctl start nfs

[root@localhost ~]# systemctl enable rpcbind

[root@localhost ~]# systemctl start rpcbind

[root@localhost ~]# systemctl status nfs 查看NFS服務的狀態

nfs-server.service - NFS server and services

Loaded: loaded (/usr/lib/systemd/system/nfs-server.service; enabled; vendor preset: disabled)

Drop-In: /run/systemd/generator/nfs-server.service.d

└─order-with-mounts.conf

Active: active (exited) since 2018-02-25 13:47:29 CST; 52s ago

Main PID: 2406 (code=exited, status=0/SUCCESS)

CGroup: /system.slice/nfs-server.service

6)查看本機共享的文件或目錄

[root@localhost ~]# exportfs

/zhangsan 192.168.115.0/24

3、客戶端配置

1)客戶端關閉防火墻和selinux,方法同上。

2)客戶端安裝NFS軟件包。

[root@localhost ~]# yum -y install nfs-utils

3)客戶端查看nfs共享狀態

[root@localhost ~]# showmount -e 192.168.115.120

Export list for 192.168.115.120:

/zhangsan 192.168.115.0/24

4)客戶端掛載nfs服務器共享目錄

[root@localhost ~]# mount 192.168.115.120:/zhangsan /media

[root@localhost ~]# df -h

文件系統 容量 已用 可用 已用% 掛載點

/dev/mapper/cl-root 17G 1.2G 16G 7% /

devtmpfs 482M 0 482M 0% /dev

tmpfs 493M 0 493M 0% /dev/shm

tmpfs 493M 6.8M 486M 2% /run

tmpfs 493M 0 493M 0% /sys/fs/cgroup

/dev/sda1 1014M 139M 876M 14% /boot

tmpfs 99M 0 99M 0% /run/user/0

192.168.115.120:/zhangsan 17G 1.2G 16G 7% /media

5)驗證客戶端和nfs服務器端文件是否一致

在服務端共享目錄/zhangsan裏創建一個文件1.txt,在客戶端的掛載目錄/media裏創建一個2.txt文件,然後查看文件。

[root@localhost ~]# ls -l /media/

-rw-r--r-- 1 root root 0 2 25 14:10 1.txt

-rw-r--r-- 1 nfsnobody nfsnobody 0 2 25 14:14 2.txt

4nfs共享權限和訪問控制

1)客戶端root用戶

使用客戶端的root身份在nfs服務器上創建文件,文件的所有者和所屬組是nfsnobody

2)客戶端普通用戶

使用客戶端的普通用戶身份在nfs服務器上創建文件,所有者和所屬組是nobody或普通用戶。

3)共享目錄的完整權限值設定/var/lib/nfs/etab

1、客戶端連接NFS的時候,對root的檢查

如果設置no_root_squash,那麽此時root用戶的身份被壓縮為NFS server上面的root

如果設置了all_squashanonuidanongid,此時root 身份被壓縮為指定用戶;

如果沒有明確指定,此時root用戶被壓縮為nfsnobody

如果同時指定no_root_squashall_squash 用戶將被壓縮為 nfsnobody,如果設置了anonuidanongid將被壓縮到所指定的用戶與組;

2、客戶端連接NFS的時候,對普通用戶的檢查

如果明確設定了普通用戶被壓縮的身份,那麽此時客戶端用戶的身份轉換為指定用戶;

如果NFS server上面有同名用戶,那麽此時客戶端登錄賬戶的身份轉換為NFS server上面的同名用戶;

如果沒有明確指定,也沒有同名用戶,那麽此時 用戶身份被壓縮成nobody

5NFS共享目錄的卸載和自動掛載

1NFS共享目錄的卸載

a、卸載客戶端的掛載目錄,在客戶端執行以下命令

[root@localhost ~]# umount /media/

b、停止服務器端的共享,在服務器端執行以下命令

[root@localhost ~]# exportfs -au

c、重新共享所有目錄並輸出詳細信息,服務器端執行以下命令

[root@localhost ~]# exportfs -rv

dexportfs命令

如果我們在啟動了NFS之後又修改了/etc/exports,是不是還要重新啟動nfs呢?這個時候我們就可以用exportfs 命令來使改動立刻生效,該命令格式如下: 

格式:exportfs [-aruv]

-a 全部掛載或卸載 /etc/exports中的內容

-r 重新讀取/etc/exports 中的信息 ,並同步更新/etc/exports/var/lib/nfs/xtab

-u 卸載單一目錄(和-a一起使用為卸載所有/etc/exports文件中的目錄)

-v export的時候,將詳細的信息輸出到屏幕上。

具體例子:

exportfs -au 卸載所有共享目錄

exportfs -rv 重新共享所有目錄並輸出詳細信息

erpcinfo命令

rpcinfo利用rpcinfo -p 可以查看出RPC開啟的端口所提供的程序有哪些,其中nfs 開啟的是2049portmapper(rpcbind) 開啟的是111,其余則是rpc開啟的

[root@localhost ~]# rpcinfo -p

program vers proto port service

100000 4 tcp 111 portmapper

100000 3 tcp 111 portmapper

100000 2 tcp 111 portmapper

100000 4 udp 111 portmapper

100000 3 udp 111 portmapper

100000 2 udp 111 portmapper

100024 1 udp 44557 status

100024 1 tcp 51424 status

100005 1 udp 20048 mountd

100005 1 tcp 20048 mountd

100005 2 udp 20048 mountd

100005 2 tcp 20048 mountd

100005 3 udp 20048 mountd

100005 3 tcp 20048 mountd

100003 3 tcp 2049 nfs

100003 4 tcp 2049 nfs

100227 3 tcp 2049 nfs_acl

100003 3 udp 2049 nfs

100003 4 udp 2049 nfs

100227 3 udp 2049 nfs_acl

100021 1 udp 48119 nlockmgr

100021 3 udp 48119 nlockmgr

100021 4 udp 48119 nlockmgr

100021 1 tcp 33728 nlockmgr

100021 3 tcp 33728 nlockmgr

100021 4 tcp 33728 nlockmgr

2NFS共享目錄的自動掛載

把掛載信息寫入到/etc/fstab文件中

[root@localhost ~]# vim /etc/fstab

………………………………………………….省略

192.168.115.120:/zhangsan /media nfs defaults 0 0

[root@localhost ~]# mount -a

[root@localhost ~]# df -h

文件系統 容量 已用 可用 已用% 掛載點

/dev/mapper/cl-root 17G 1.2G 16G 7% /

devtmpfs 482M 0 482M 0% /dev

tmpfs 493M 0 493M 0% /dev/shm

tmpfs 493M 6.8M 486M 2% /run

tmpfs 493M 0 493M 0% /sys/fs/cgroup

/dev/sda1 1014M 139M 876M 14% /boot

tmpfs 99M 0 99M 0% /run/user/0

192.168.115.120:/zhangsan 17G 1.2G 16G 7% /media

6NFS常見故障解決方法

1The rpcbind failure error

故障現象:

nfs mount: server1:: RPC: Rpcbind failure

RPC: Timed Out

nfs mount: retrying: /mntpoint

故障原因:

第一,可能因為客戶機的hosts文件中存在錯誤的ip地址、主機名或節點名組合;

第二,服務器因為過載而暫時停止服務。

2The server not responding error

故障現象:

NFS server server2 not responding, still trying

故障原因:

第一,網絡不通,用ping命令檢測一下。

第二,服務器關機。

3The NFS client fails a reboot error

故障現象:

啟動客戶機後停住了,不斷顯示如下提示信息:

Setting default interface for multicast: add net 224.0.0.0: gateway:

client_node_name.

故障原因:

etc/vfstabmount選項中使用了fg而又無法成功mount服務器上的資源,改成bg或將該行註釋掉,直到服務器可用為止。

4The service not responding error

故障現象:

nfs mount: dbserver: NFS: Service not responding

nfs mount: retrying: /mntpoint

故障原因:

第一,當前級別不是級別3,用who -r查看,用init 3切換。

第二,NFS Server守護進程不存在,用ps -ef | grep nfs檢查,用/etc/init.d/nfs start啟動。

5The program not registered error

故障現象:

nfs mount: dbserver: RPC: Program not registered

nfs mount: retrying: /mntpoint

故障原因:

第一,當前級別不是級別3

第二,mountd守護進程沒有啟動,用/etc/init.d/nfs腳本啟動NFS守護進程。

第三,看/etc/dfs/dfstab中的條目是否正常。

6The stale file handle error

故障現象:

stale NFS file handle

故障原因:

服務器上的共享資源移動位置了,在客戶端使用umountmount重新掛接就可以了。

7The unknown host error

故障現象:

nfs mount: sserver1:: RPC: Unknown host

故障原因:

hosts文件中的內容不正確。

8The mount point error

故障現象:

mount: mount-point /DS9 does not exist.

故障原因:

該掛接點在客戶機上不存在,註意檢查命令行或/etc/vfstab文件中相關條目的拼寫。

9The no such file error

故障現象:

No such file or directory.

故障原因:

該掛接點在服務器上不存在,註意檢查命令行或/etc/vfstab文件中相關條目的拼寫。

10No route to host

故障現象:

# mount 192.168.115.120:/opt/data /data -t nfs -o rw

mount: mount to NFS server ‘192.168.115.120’ failed: System Error: No route to host.

故障原因:

防火墻被打開,關閉防火墻。

這個原因很多人都忽視了,如果開啟了防火墻(包括iptables和硬件防火墻),NFS默認使用111端口,我們先要檢測是否打開了這個端口,還要檢查TCP_Wrappers的設定。

11Not owner

故障現象:

# mount -F nfs -o rw 192.168.115.120:/mnt/data /data

nfs mount: mount: /data: Not owner

故障原因:

這是Solaris 10版本掛載較低版本nfs時報的錯誤。

解決:

需要用-o vers=3參數

示例:

# mount -F nfs -o vers=3 192.168.115.120:/mnt/data /data

12RPC: Program not registered & retrying

故障現象:

nfs mount: 192.168.115.120: : RPC: Program not registered

nfs mount: retrying: /data

故障原因:

沒有啟動NFS共享端服務。

解決:需要重新啟動share端的NFS服務,

Linux:

mount: RPC: Program not registered

# /etc/init.d/nfs restart

Solaris:

mount: RPC: Program not registered

# /etc/rc.d/init.d/nfs restart

13cant contact portmapper: RPC: Remote system error Connection refused

故障現象:

# exportfs -a

can’t contact portmapper: RPC: Remote system error – Connection refused

故障原因:

出現這個錯誤信息是由於server端的portmap沒有啟動。

解決:

# /etc/init.d/portmap start


NFS服務的簡介及常見故障解決方法