1. 程式人生 > >POJ 3233 Matrix Power Series(求矩陣冪的和——分塊矩陣快速冪 or 二分遞迴+矩陣快速冪)

POJ 3233 Matrix Power Series(求矩陣冪的和——分塊矩陣快速冪 or 二分遞迴+矩陣快速冪)

Matrix Power Series
Time Limit: 3000MS Memory Limit: 131072K
Total Submissions: 21451 Accepted: 8993

Description

Given a n × n matrix A and a positive integer k, find the sum S = A + A2 + A3 + … + Ak.

Input

The input contains exactly one test case. The first line of input contains three positive integers n (n ≤ 30), k

 (k ≤ 109) and m (m < 104). Then follow n lines each containing n nonnegative integers below 32,768, giving A’s elements in row-major order.

Output

Output the elements of S modulo m in the same way as A is given.

Sample Input

2 2 4
0 1
1 1

Sample Output

1 2
2 3

題意:給定 n*n 的矩陣A和正整數 k 和 m 。 求矩陣A的冪之和。 S = A + A

^2 + A^3 + ... + A^k    輸出S的各元素對m取餘的結果。  

知識儲備: 矩陣   矩陣乘法  單位矩陣  分塊矩陣  

題解:

方法一:構造法

因為分塊矩陣依然滿足矩陣乘法,所以可以構造成分塊矩陣冪求解,詳見 《挑戰》 P.205

程式碼如下:

#include <iostream>
#include <cstdio>
#include <cstring>
#include <cmath>
#include <vector>
#include <algorithm>
using namespace std;
#define LL long long 
#define maxn 35
typedef vector<LL> vec;
typedef vector<vec> mat;
int m;

mat mul(mat &A, mat &B)//矩陣乘法 
{
	mat C(A.size(), vec(B[0].size()));
	for(int i=0; i<A.size(); ++i)
	{
		for(int k=0; k<B.size(); ++k)
		{
			for(int j=0; j<B[0].size(); ++j)
				C[i][j] = (C[i][j] + A[i][k]*B[k][j]) % m;
		}
	}
	return C;
}

mat quick_pow(mat A,int n)//快速冪 
{
	mat B(A.size(), vec(A.size()));
	for(int i=0; i<A.size(); ++i)
		B[i][i]=1;
	while(n>0)
	{
		if(n&1)
			B = mul(B, A);
		A = mul(A, A);
		n >>= 1;
	}
	return B;
}

int main()
{
	int n,k;
	LL a;
	while(scanf("%d%d%d",&n,&k,&m)!=EOF)
	{
		mat A(n*2, vec(n*2));
		for(int i=0; i<n; ++i)
		{
			for(int j=0; j<n; ++j)
			{
				scanf("%lld",&a);
				A[i][j] = a;
			}
			A[n+i][i] = 1;	A[n+i][n+i] = 1;//構造出分塊矩陣下方的兩個單位矩陣塊 
		}
		A = quick_pow(A, k+1);// I+A+A^2+...+A^k,構造後的 S(k) = I+A+...+A^k-1 ,所以這裡我們要求出S(k+1) 
		for(int i=0; i<n; ++i)
		{
			for(int j=0; j<n ;++j)
			{
				a = A[n+i][j] % m;
				if(i==j)//減去最早加上的單位矩陣 
					a = (a+m-1) % m;
				if(j==n-1)
					printf("%lld\n",a);
				else
					printf("%lld ",a);
			}	
		}
	}
	return 0;
} 


方法二: 二分+矩陣快速冪

我們知道對於矩陣 A^x 可以用矩陣快速冪 快速的求解。 我們要考慮的是怎麼減少 求解 S = A + A^2 + A^3 +...+A^k 過程中的 相加 這個操作的耗時。 下面我們把 矩陣A 看成一個普通的 數字A 

對於S(10)我們有: 

S(10) = A + A^2 + A^3 +A^4 + A^5 + A^5 * (A +  A^2 +A^3 +A^4 + A^5 )

對於S(5)我們有:

S(5) = A + A^2 +A^3 + A^3 * (A + A^2)

對於S(2)我們有:

S(2) = A + A * (A)

題中已經給出了 A 的值, 那麼我們可以通過遞歸回溯得到S(2)的值,求出A^3的值,就可以通過上面的式子得到S(5)的值, 進而得到S(10)的值。 那麼對於每個S(k)我們都可以這樣二分遞迴求解。 注意這裡的S(n)當n為奇數需要多加上一次A^(n/2+1)的值( 例如上面的S(5) )。 最後加上矩陣的快速冪 與 加法操作就行了。

程式碼如下:

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
#define LL long long
#define maxn 40
int n,m,k;
struct Node
{
	LL mat[maxn][maxn];
}A;

Node mul(Node B, Node C)//矩陣乘法 
{
	Node D;
	for(int i=0; i<n; ++i)
		for(int j=0; j<n; ++j)
			D.mat[i][j] = 0;
	for(int i=0; i<n ;++i)
	{
		for(int k=0; k<n; ++k)
		{
			for(int j=0; j<n; ++j)
				D.mat[i][j] = (D.mat[i][j] + B.mat[i][k]*C.mat[k][j]) % m;
		}
	}
	return D;
}

Node quick_pow(Node B,int x)//快速冪 
{
	Node C;
	for(int i=0; i<n; ++i)
		for(int j=0; j<n; ++j)//初始化為單位矩陣 
			C.mat[i][j] = (i==j?1:0);
	while(x>0)
	{
		if(x&1)
			C = mul(C, B);
		B = mul(B, B);
		x >>= 1;
	}
	return C;
}

Node Add(Node B, Node C)//矩陣加法 
{
	Node D;
	for(int i=0; i<n; ++i)
	{
		for(int j=0; j<n; ++j)
			D.mat[i][j] = (B.mat[i][j] + C.mat[i][j]) % m;
	}
	return D;
}


Node dfs(int x)
{
	if(x==1)	
		return A;
	Node ans = dfs(x/2), temp;
	if(x&1){
		temp = quick_pow(A, x/2+1);
		ans = Add(ans, mul(temp, ans));
		ans = Add(temp, ans);//奇數情況要加上中間的矩陣 
	}
	else{
		temp = quick_pow(A, x/2);
		ans = Add(ans, mul(temp, ans));
	}
	return ans;
}

int main()
{
	while(scanf("%d%d%d",&n,&k,&m)!=EOF)
	{
		for(int i=0; i<n; ++i)
		{
			for(int j=0; j<n; ++j)
				scanf("%lld",&A.mat[i][j]);
		}
		Node ans = dfs(k);
		for(int i=0; i<n; ++i)
		{
			for(int j=0; j<n-1; ++j)
				printf("%lld ",ans.mat[i][j]);
			printf("%lld\n",ans.mat[i][n-1]);
		}	
	}
	return 0;
}