求解差分约束系统

差分约束系统是一个N元一次不等式组,由多组形如x_i-x_j \leqslant c_k的不等式组成。一个差分约束系统要么无解,要么有无数组解。

Part 1 前置技能

在了解如何判断一个差分约束系统是否有解,或者求出它的一组解之前,我们需要先掌握它的前置技能。

  • 图论基本概念
  • 求单源最短/长路的方法

讲解图论的算法书籍都会讲解单源最短路的求法。在边权非负时,我们通常使用 Dijkstra 算法或 Bellman-Ford算法(以及它们的堆/队列优化算法)。Dijkstra算法不能处理负权存在时的情况,也不能求出单源最长路。Bellman-Ford算法及其队列优化的SPFA算法可以处理边带负权的情况,于是可以通过将边权取相反数的方法求出单源最长路。(见这里Bellman-Ford算法及其队列优化的SPFA算法都可以判断图中是否存在负环,并且会在d[x]>d[y]+w(y,x)时用y点更新d[x]

在单源最短路算法结束后,假如图G(V,E)中没有负环,那么必有:

\forall i,j \in V , d[i] \leqslant d[j]+w(j,i)

在你搞清楚上面两种SSSP问题求解的算法之后,我们就可以通过以下方式判断负环:

对于Bellman-Ford算法:

每次操作后,总会有一个点收敛。如果没有负环,经过n-1轮迭代后必然不会再有点的路径长度被更新。如果迭代n-1轮后仍然有点的距离可以被更新,那么说明一定有负环。

对于SPFA算法:

假如在用算法进行处理时,一个点的最短路径经过的边数已经大于n-1(即必然重复走了很多边和点),那么说明一定有些点可被重复走过,且重复经过这些点之后可以使距离更小。也就是说,图里有负环。使用一个数组cnt[]记录每个点当前所求最短路经过了多少边就可以解决这个问题。方法是在用x更新y时,令cnt[y]=cnt[x]+1,并判断是否cnt[y] >  n-1

Part 2 求解差分约束系统

在理解Part 1的内容后,我们就可以用它来求解差分约束系统了。

如前所述,差分约束系统中的不等式形式是:

x_i-x_j \leqslant c_k

(例如x_2 - x_1 \leqslant 6)

而一个没有负环的图在跑完单源最短路算法后,满足:

\forall i,j \in V , d[i] \leqslant d[j]+w(j,i)

那么我们能否利用这个形式上的共同性来将求解差分约束系统的问题转化为图上的问题,然后利用图论算法求解?

当然可以。设有图G(V,E),对于差分约束系统中的每组关系 x_i-x_j \leqslant c_k(i,j \in V),我们从j点向i点连接一条权值为c_k的有向边。

假如从这个图的某点出发的单源最短路径为d[i](i \in V),满足 \forall i,j \in V , d[i] \leqslant d[j]+w(j,i) ,那么这个差分约束系统必然是有解的,d[i]就是其中一组解。如果有一组解\{ x_1,x_2,...,x_n \},那么\{ x_1+k,x_2+k,...,x_n+k \} (k \in \mathbb{R}  )也必然是一组解。即它有无数组解。

假如这个图有负环,那么无论如何都有点不满足d[i] \leqslant d[j]+w(j,i)。所以这个不等式组必然没有解。

那假如这个图根本就没有联通呢?只要在每个联通块内不存在负环,那么它也是有解的。我们当然可以对每一个联通块都查找一次负环,但这样太繁琐了。(还要用并查集维护每一块的大小和联通关系)怎么解决?

由上面的推导可以知道,只要一个差分约束系统是有解的,那么它必然有无数组解。我们可以假设它有一组元素均小于等于p的解(p=0则代表求出一组均为负数的解),然后构造一组新的不等式组:

x_i - x_0 \leqslant 0

也就是从点0连一条到点i的权值为0的有向边。

并且令:

d[0]=p

那么我们就可以把这个图联通起来一次跑过了。

Part 3 变形的处理

我们已经能够处理形如x_i-x_j \leqslant c_k的情况了。那如何解决由形如x_i-x_j \geqslant c_k的不等式构成的差分约束系统问题?方法有二:

Way 1 数学变换

很容易将 x_i-x_j \geqslant c_k 变形为x_j-x_i \leqslant -c_k。然后就可以按照之前的步骤求解。(注意Dijkstra算法不可处理带负边权的图)

Way 2改求最长路

对于一个没有正环(走一次边权和为正值)的图,我们可以求解出它每个点从某点出发的单源最长路经d[]

那么一定有:

\forall i,j \in V , d[i] \geqslant d[j]+w(j,i)

同样的,对于不等式 x_i-x_j \geqslant c_k ,我们连一条从ji的边权为c_k 的有向边。可以设虚点使图联通。假如这个图有正环,那么说明该不等式组无解。反之则有解。

求最长路就只能用Bellman-Ford算法(或其队列优化算法SPFA)了。找正环的方法同负环一样。

需要注意的是,如果我们通过计算最短路来求解查分约束系统,那么其求得的值是满足约束条件的最大值。因为最后\forall i,j \in V,d[i] \leqslant d[j] +w(j,i),也就是说每个点满足的是上界条件。如果用最长路来求解,则求解出的答案是满足条件的最小值,理由同上。

有些时候,我们不需要求解,或者在求解之前要先判断整个图的连通性,可以先从一个虚点向每个点连一条线使得图联通,即使添加这个虚点而增加的条件是我们不需要的。然后再不考虑虚点求解。

你可以尝试这几个题(来自李煜东等的书籍推荐):

1.P2868 [USACO07DEC]观光奶牛Sightseeing Cows

2.UVA1723 Intervals

3.P4878 [USACO05DEC] 布局

参考资料:

What can stop me?

前两天和我妈吃饭,她提起一个问题:我还要不要继续学奥赛。

其实我并不觉得奥赛让我成绩怎么退步了。反而在奥赛班里年级排名还比以前上升了很多。

但是她觉得我压力太大了。

其实我自己也还不这么觉得。

所以这些东西其实都不能让我停下手上的奥赛。

但是

这段时间隐约发现自己要秃了。

今天给新学奥赛的学妹带了一瓶洗洁精。晚上回家看到她给我发的QQ消息如下:

我现在觉得,我要是在比赛之前没学奥赛了,肯定不会是因为压力。

而肯定会是因为我怕秃头。

题解 P1494 【[国家集训队]小Z的袜子】

看了一下题解里的大佬,好像都用的莫队或者分块维护平方和…

其实用不着维护平方和。

从头开始说吧。

求什么

对于每个询问qq包含q.l,q.r),我们要求出任取两个袜子颜色相同的概率。假设在区间[l,r]取到颜色为i的袜子的概率为P(l,r,i),那么要求的就是\sum_{i=1} ^{n} P(q.l,q.r,i)

怎么求

那么对于任意的L,R,i,如何计算P(L,R,i)?假设在[L,R]i袜子的个数为n_i,根据数学知识,要取到两只i,首先要取第一只i颜色的袜子。因为有n_i只袜子都是i颜色的,所以取第一只i袜子的方案数为n_i。然后再取第二只i颜色的袜子。由于已经取了1只i颜色的袜子,就只剩下i-1只可选了。这样的排列数有n*(n-1)个。

计算概率时有顺序用排列,无顺序用组合,因为我们只关心两只袜子是否颜色相同,所以这道题中选袜子的顺序是没有影响的。而刚刚计算的只是排列数,每种组合方式被计算了2次(选第1,3只白袜和选第3,1只白袜是一样的)。所以要除以2。
即选到两只i颜色的袜子的方案数n_i(n_i-1)/2.

[L,R]内,有R-L+1只袜子,在这其中选择两只,方案总数为C_{R-L+1}^2。(都在刷国家集训队的题目了,你应该知道组合数吧….

所以P(L,R,i)=n_i*(n_i-1)/2 C_{R-L+1}^2 .

答案如前所述,为\sum_{i=1} ^{n} P(q.l,q.r,i)

怎么优化

1.分块。

如果直接对每个询问区间暴力维护n_iO(m* k n)级别的复杂度很显然过不了。(k是一个常数。其实我不太会分析复杂度所以欢迎dalao指正

以样例为例,(话说这个样例不会被敏感词拦截吗)

6 4

1 2 3 3 3 2

2 6

1 3

3 5

1 6

样例图解

我们发现一些询问都和其它某(几)个询问有重叠部分。那其实,我们可以把有重叠部分的询问分组,先处理每组的第一个询问,然后处理与上一个询问不同的部分。

于是我们可以先按照左端点的大小排序,然后把排序后的队列分成几个小块(一般大小取\sqrt{m})。然后再在每个块内以右端点大小排序。我们就可以以块为单位处理。

虽然左端点的单调性在第二次排序的时候打乱了,但是第一次排序保证了同一个块内相邻两个左端点的变化在\sqrt{n}内。第二排序可以保证右端点只有加操作,没有减操作。

2.统计

前面有些大佬提到了维护平方和的办法。但是其实我认为有更好的办法(每次修改三行代码变为一行)。
进入每一个块内处理的时候,我们先暴力求出第一组询问的区间内,每个袜子的个数,存在数组num里。然后在前一个询问的基础上,对num修改。
根据前面的推导,对每个询问q,我们要求的是

\sum_{i=1}^{n}P(q.l,q.r,i)=num_i*(num_i-1)/2 C_{q.r-q.l+1}^2 .

(C右上角的2不是平方的意思…)

可以看出,同一个询问的分母都是确定的。所以我们现在关心如何通过修改num来快速得到分子。

重点来了,假设原来的num_i=x

假如我们要对num_i执行增加1的操作,那么实际上跟i有关的那一部分的分子的变化为:
增加后-增加前=(x+1)x-x(x-1)=2x.所以我们直接加上原来x的两倍即可。

假如我们要对num_i执行减小1的操作,那么实际上i这一部分分子的变化为:

减少后-减少前= (x-1)(x-2)-x(x-1)=-2(x-1),所以我们直接减去减少后的num_i的两倍即可。

于是以前的更改代码为:(以增加为例)

{

    tot-=num[i]* num[i];
    num[i]++;
    tot+=num[i]* num[i]; 
}

现在只需要:

{
    tot+=2* num[i]++;
}

但是….分母不是还有一个2么,直接约分不就行了…

于是乘以2可以直接省略,得到:

{
    tot+=num[i]++;
}

不开O2 363ms

开O2 191ms

细节见代码:

#include<cstdio>
#include<algorithm>
#include<cmath>
#include<cstring>
using std::sort;
const int maxn=50000;
struct que
{
    int l,r,id;
}q[maxn+5];
struct blk
{
    int l,r;
}b[333];
int col[maxn+5],num[maxn+5],ans1[maxn+5],ans2[maxn+5],c[maxn+5][3];
//依次保存 颜色,上文中的num数组,分子,分母,组合数
int n,m,bs,bn,tot;
//bs为每个块的大小 bn为块的个数
//排序后可以一边分块一边计算
inline void read(int &x){//快读
    x=0;
    char c;
    do{
        c=getchar();
    }
    while(c<'0'||c>'9');
    do{
        x=x*10+c-'0';
        c=getchar();
    }
    while(c>='0'&&c<='9');
}
inline int min(int a,int b){
    return a<b?a:b;
}
inline int gcd(int a,int b){
    return b?gcd(b,a%b):a;
}
inline bool cmpl(que a,que b){//以l排序
    return a.l<b.l;
}
inline bool cmpr(que a,que b){//以r排序
    return a.r<b.r;
}
inline void pre(){//计算组合数
    c[1][0]=c[1][1]=1;
    for(register int i=2,j;i<=n;++i){
        c[i][0]=1;
        for(j=1;j<=2;++j){
            c[i][j]=c[i-1][j-1]+c[i-1][j];
        }
    }
}
int main(){
    read(n);
    read(m);
    pre();
    for(register int i=1;i<=n;++i){
        read(col[i]);
    }
    for(register int i=1;i<=m;++i){
        read(q[i].l);
        read(q[i].r);
        q[i].id=i;
    }
    bs=sqrt(m);
    sort(q+1,q+1+m,cmpl);
    //整体按l排序,保证每个块内左端点的变化不会太大
    for(register int i=1,g;i<=m;i+=bs){
    //i为每个块的左边界
        b[++bn].l=i;
        b[bn].r=min(i+bs-1,m);
        sort(q+i,q+b[bn].r+1,cmpr);//块内按右端点排序 以免右边反复无用增减                    
        memset(num,0,sizeof(num));
        tot=0;//分子
        //先处理这个块里的第一个询问
        for(register int j=q[b[bn].l].l;j<=q[b[bn].l].r;++j){
            tot+=num[col[j]]++;
        }
        ans1[q[b[bn].l].id]=tot;
        ans2[q[b[bn].l].id]=c[q[b[bn].l].r-q[b[bn].l].l+1][2];
        //分母无需再乘以二,因为分子计算的时候省略了二
        if(ans1[q[b[bn].l].id]==0)ans2[q[b[bn].l].id]=1;
        else {
                g=gcd(tot,ans2[q[b[bn].l].id]);
                ans1[q[b[bn].l].id]/=g;
                ans2[q[b[bn].l].id]/=g;
         }

         //在前面的基础上,处理块内其他询问
        for(register int k,j=b[bn].l+1;j<=b[bn].r;++j){
             if(q[j-1].l<q[j].l){//处理这一次询问少了的部分(复原)
                 for(k=q[j-1].l;k<q[j].l;++k){
                    tot-=--num[col[k]];
                    //注意运算符在前(根据推导,这里使用减少后的值)
                 }
             }
             else {
                for(k=q[j].l;k<q[j-1].l;++k){//处理这一次询问多出来的部分
                    tot+=num[col[k]]++;
                    //注意运算符在后(根据推导,这里使用增加前的值)
                }
             }

             for(k=q[j-1].r+1;k<=q[j].r;++k){//处理这个询问后面多出来的部分
                tot+=num[col[k]]++;
             }
             ans1[q[j].id]=tot;
             ans2[q[j].id]=c[q[j].r-q[j].l+1][2];
             if(ans1[q[j].id]==0)ans2[q[j].id]=1;
             else {
                g=gcd(tot,ans2[q[j].id]);
                ans1[q[j].id]/=g;
                ans2[q[j].id]/=g;
             }
        }
    }
    for(register int i=1;i<=m;++i){
        printf("%d/%d\n",ans1[i],ans2[i]);
    }
    // system("pause");
    return 0;
}

祝AC..

数列分块心得

//作者过弱, 此文过水, 不建议阅读

关于标记的用法

例如,在动态维护区间和的时候(虽然很多时候用线段树或者树状数组更方便),假如每块有3个属性:add,l,rlr标记了它的左端点和右端点,但add有两种用法:

1.在查询整体和的时候使用。(李煜东的书给出的就是这种)

当要使第i块每个元素都增加c时,执行add[i]+=c,然后逐一更新该块中每一项的值a[j] ,使其增加c。//O(1)O(n)

当要查询时,如果查询该块的某部分,则逐一累加那一部分的元素然后返回;如果查询整体的和,就直接返回原始处理的sum加上add[i]*len[i]。//O(n)O(1)

2.查询部分元素的时候使用。

当要使第i块每个元素都增加c时,执行add[i]+=c,然后把sum[i]加上len[i]*c;//O(1)O(1)

当要查询时,如果查询该块的某部分,则逐一累加那一部分,然后加上add[i]*(这一部分的长度);如果查询整体的和,直接返回sum[i];//O(n)O(1)

第二种方法可以在修改的时候省掉一个O(n)

关于每块元素的个数

方法不同的话,长度为n的数列每一块的元素个数不一定是\sqrt{n},也不一定小于它。可能大于它。

例如,如果以李煜东书上的分块方法,给24个元素的数列分块,每一块的元素个数分别为:4,4,4,4,8。(就因为这个原因一道题卡了很久。不过他这种方法应该是错的吧…)

Hash

Hash表也叫散列表,可以将复杂而庞大的数据映射到一定的小范围内。缺点是可能出现冲突,但可以用链表的方法解决。

几个常用质数:99991,10007,131,13331。

10003不是质数。它等于7*1429;10007是,但100007不是,它等于97*1031;

字符串Hash

可以把字符串看做一个P进制的数,通过数的运算可以比较字符串字典序(先通过二分找到最长前缀,然后比较最长前缀的下一个数)。

例如,CH_1402 后缀数组

在结尾都相同时,可以这样写:

inline bool cmp(int a,int b){
int mid,l=0,r=min(len-a+1,len-b+1);
while(l>1;
if(eql(a,a+mid-1,b,b+mid-1)){//记得-1 求的是长度
l=mid;
}
else r=mid-1;
}
return s[a+l]<s[b+l];
}

如果结尾不同,在l等于它们其中任意一个字符串的长度时,s[a+l]s[b+l]可能访问到其它字符(如果都保存在同一个字符数组里的话)。

如果要求最长前缀的话也可以这样写,直接将返回类型bool改为int,并且返回l即可。

字符串哈希也可以用于比较两段字符串大小:

inline bool eql(int l1,int r1,int l2,int r2){
return f[r1]-f[l1-1]p[r1-l1+1]==f[r2]-f[l2-1]p[r2-l2+1];

如果要判断回文串,可以从前往后、从后往前分别开两个数组记录字符串的Hash。求最长回文串还有一个马拉车(Manacher)算法,找时间去研究一下。

随手写的,可能没有阅读体验,仅供自己学习。

以后遇到再来补充。

出栈的合法顺序

(这是一篇水贴)

在把1到n这n个数依次入栈的情况下,如何判断出栈的顺序是否合法?

如果仅仅要求顺序合法,我们可以在已经得到了一个出栈序列的情况下,以如下的方式判断。

         int A=1,B=1;
         stack s;
         while(A<=n){
             if(a[A]==B){
                 A++;B++;
             }
             else if(!s.empty()&&s.top()==a[A]){
                 s.pop();
                 A++;
             }
             else if(B<=n){
                 s.push(B++);
             }
             else {
                 break;//不合法
             }
         }

我们可以以生成全排列的方法,借用这种判断方式来暴力求出合理的出栈顺序的数量。(当然,可以数论直接求解)

也可以直接高效生成(以下代码来自SE大佬):

      inline void dfs(int s) {
      if(cnt == n) {
      num++;
      /* 
      for (int i = 1;i <= n; ++i) printf("%d", c[i]);  
      printf("\n");  
      */  
      return;  
  }
  if (top > 0) {
      int tp = a[top--];  
      c[++cnt] = tp;  
      dfs(s);  
      a[++top] = tp;
      cnt--;   
  }
  if (s <= n) { 
      a[++top] = s;  
      dfs(s+1);  
      top--;  
   }  
 }  
  int main(){  
      scanf("%d", &n);  
      dfs(1); 
      printf("%d", num);  
      return 0;  
  }